Seedance 2.0的熱度還沒下去,字節(jié)新模型又來了!
智東西2月10日報(bào)道,今日,字節(jié)圖像生成模型Seedream 5.0 Preview在視頻編輯應(yīng)用剪映、剪映海外版Capcut、字節(jié)AI創(chuàng)作平臺小云雀均已上線,在即夢AI平臺開啟灰度測試,圖片生成可限時(shí)免費(fèi)體驗(yàn)。

Capcut官宣截圖(左)、小云雀主頁模型選擇(右)
Seedream 5.0 Preview的圖像支持2K和4K分辨率輸出,2K為圖片生成直出,4K為AI增強(qiáng)后的分辨率。根據(jù)Capcut官網(wǎng),新模型5.0的升級點(diǎn)為首次支持檢索生圖,對提示詞的理解準(zhǔn)確性增強(qiáng)、支持更細(xì)節(jié)、精致紋理的圖像生成,還允許用戶精確調(diào)整圖像。Seedream 4.5于2025年12月4日上線。
智東西實(shí)際體驗(yàn)并對比了Seedream 5.0 Preview與Nano Banana Pro、Seedream 4.5,發(fā)現(xiàn)新模型可以理解“靜謐科技感”等抽象提示詞,但最后的生成效果相比Seedream 4.5很難說有跨越式提升,其聯(lián)網(wǎng)搜索能力尚不穩(wěn)定、生成效果升級點(diǎn)體現(xiàn)在更美觀、多樣化上。
Capcut的官宣推文里提到,Seedream 5.0 Preview可與Nano Banana Pro對標(biāo),且更便宜,目前所有用戶可免費(fèi)使用20次,美國地區(qū)之后上線。有網(wǎng)友對比了Nano Banana Pro、ChatGPT、Seedream 5.0 Preview、Grok Imagine Image的生成效果,其提示詞為:生成一張高質(zhì)量的信息圖,解釋在特拉普修道院制作啤酒的過程,并配有豐富的插圖。

第一排從左至右為Nano Banana Pro、ChatGPT生成,第二排從左至右為Seedream 5.0 Preview、Grok Imagine Image生成
相比于其他幾個(gè),Seedream 5.0 Preview的步驟解釋最為詳細(xì),每步都有詳細(xì)的文字說明,但藝術(shù)設(shè)計(jì)感相比Nano Banana Pro稍弱。
從社交平臺X上的網(wǎng)友評論來看,此次Seedream 5.0預(yù)覽版的升級優(yōu)先考慮的是智能水平而非美觀,可以應(yīng)對復(fù)雜的知識驅(qū)動型任務(wù)。

有網(wǎng)友認(rèn)為,Seedream 5.0 Preview的智能水平、中文能力有提升,但都比不上Nano Banana Pro。

還有網(wǎng)友調(diào)侃,新模型的進(jìn)步程度僅0.09,僅相當(dāng)于加了網(wǎng)絡(luò)搜索的Seedream 4.5。

一、三大能力增強(qiáng),主攻實(shí)用性需求
根據(jù)Capcut官網(wǎng),此次Seedream 5.0 Preview的重要升級點(diǎn)包括準(zhǔn)確性與智能水平增強(qiáng)、更快更具表現(xiàn)力的圖像創(chuàng)建、支持聯(lián)網(wǎng)知識整合。
首先在智能水平方面,Seedream 5.0 Preview能深入理解提示詞,生成與用戶意圖相匹配、細(xì)節(jié)精準(zhǔn)、布局清晰、文本渲染效果更佳的圖像。
第二點(diǎn)是增強(qiáng)風(fēng)格化效果,其圖像到圖像功能增強(qiáng)了風(fēng)格化效果,模型可以提供更清晰的細(xì)節(jié)、精致的紋理和平衡的照明。該模型還新增了編輯功能,用戶可以控制筆刷精準(zhǔn)選擇并調(diào)整相應(yīng)元素。
最后是智能推理能力,其官網(wǎng)提到,新模型的多步邏輯、空間理解及特定領(lǐng)域知識增強(qiáng)。
二、相較Seedream 4.5提升小,能理解抽象需求
智東西體驗(yàn)了Seedream 5.0 Preview的圖片生成能力。
第一個(gè)提示詞是“為《靜夜思》生成古詩插圖”,可以看到生成的結(jié)果中人物“舉頭望明月”這一關(guān)鍵元素都沒有缺失,還附上了人物在月光下的影子等,但原詩中的“床前”等沒有在圖片中涉及到。

為了考驗(yàn)Seedream 5.0 Preview的聯(lián)網(wǎng)搜索能力,智東西輸入了提示詞“最近有很多家機(jī)器人都要參加2026春晚,生成一張已官宣參加春晚的機(jī)器人海報(bào)”。
Seedream 5.0 Preview生成的視覺元素準(zhǔn)確,在大段文字生成中也未出現(xiàn)亂碼,表現(xiàn)穩(wěn)定。但其并沒有理解“已官宣參加春晚的機(jī)器人”,而是僅生成了機(jī)器人上春晚的海報(bào)。

還有抽象的提示詞,智東西輸入“生成一個(gè)靜謐科技感且?guī)в新淙沼鄷煼諊聂[鐘圖片”,新模型生成的圖片中,從鬧鐘的設(shè)計(jì)到背景將落日、科技感融合在了一起。

關(guān)于更為細(xì)致的圖像輸出,提示詞為“特寫電影感肖像,一位有雀斑、深色卷發(fā)的年輕女性,被鮮艷的野花和藤蔓環(huán)繞,頭上戴著花冠。在黃金時(shí)段拍攝,溫暖的逆光在她的頭發(fā)和皮膚上形成光暈,淺景深,前景花朵柔焦,照片級真實(shí)感”。
可以看到,輸出的圖片中的逆光效果非常到位,發(fā)絲邊緣的光暈、皮膚的光澤以及前景花朵的柔焦虛化,都營造出了自然的氛圍感。

當(dāng)智東西的提示詞為“最新奧斯卡獲獎?wù)呒t毯風(fēng)格”時(shí),Seedream 5.0 Preview可以直接生成有紅毯、背景板、攝影師的完整圖像,背景板還有不少奧斯卡的小金人。

根據(jù)參考圖生成圖片方面,智東西上傳了最近熱度超高的《閃靈》男主杰克,并讓Seedream 5.0 Preview“生成這個(gè)人的拜年圖片,主人公要身有年味的服裝,手拿燈籠和對聯(lián)”。
生成的效果中,主人公的面部與參考圖一致,手拿燈籠、對聯(lián)的元素也都具備。

智東西還比較了Seedream 5.0 Preview與Nano Banana Pro的生成效果。一個(gè)超難提示詞為“生成一個(gè)用左手寫字的人,背景有一個(gè)顯示5:25的模擬時(shí)鐘”,Seedream 5.0 Preview與Nano Banana都失敗了,要么是拿筆的手不對,要么是背景的鐘表時(shí)間不對。
Nano Banana Pro生成的圖片中,人物握筆的手為左手,可以從模糊的時(shí)鐘看出其時(shí)間為5:30左右。
