阿里巴巴推出統一的圖像生成和編輯模型 Wan2.7 Image,這是一款旨在革新影像產生和編輯領域的統一人工智慧模型,它能顯著提升創作者製作高保真、個性化視覺作品的能力,並達到專業級的精準度。
模型具備以下功能:可精細控制虛擬化身的臉部骨骼結構和眼型;提供調色板系統,用於提取和應用一致的配色方案;支援像素級元素操作的精確選框編輯;支援 12 種語言、最多 3000 個詞元的多語言文字渲染;以及在單一輸出中合成最多 12 張圖像的功能。
作為一款旨在處理設計流程各個環節的一體化創意工具,Wan2.7-Image 不僅能夠讓創作者根據文字生成圖像,還能透過同時處理多幅圖像來提高工作效率。它透過簡單易用的指令式編輯功能,為視覺效果帶來精細的調整。在匿名使用者偏好測試中,該模型憑藉著卓越的視覺保真度、精準的文字渲染以及對複雜視覺概念的深刻理解,超越了業界領先的同類產品。
Wan2.7-Image 以深度個人化取代了傳統 AI 的通用標準化外觀。這使用戶能夠微調骨骼結構和眼睛形狀等特定特徵,從而為每個項目打造真正獨特、栩栩如生的角色。它還透過全新的「調色板」功能徹底解決了 AI 色彩渲染的猜測問題:創作者只需在提示框中輸入特定的顏色代碼和比例,即可複製複雜的藝術風格或鎖定精確的品牌顏色,確保每張圖像都完美契合他們的願景或企業準則。
Wan2.7-Image 在文字渲染方面也取得了重大突破,而文字渲染一直是人工智慧領域的一大挑戰。由於能夠處理超長文本序列的長上下文學習框架,Wan2.7-Image 可以處理多達 3000 個字元的文字輸入。該模型支援 12 種語言,能夠產生印刷品質的學術文本、複雜的公式和表格。此外,該模型最多可使用 9 張參考圖像,並一次生成多達 12 張圖像,從而輕鬆創建連貫的故事板、建築渲染圖和電商行銷活動。
目前該系列模型可以在阿里雲人工智慧開發平台 Model Studio 和 Wan 官網存取和部署這些模型。
https://kopyai.com/zh-tw/latest/view/type.news/0/64Picture Source
Alibaba Cloud

留言
張貼留言