阿里巴巴發布圖像生成模型 Wan2.7-Image

阿里巴巴推出統一的圖像生成和編輯模型 Wan2.7 Image，這是一款旨在革新影像產生和編輯領域的統一人工智慧模型，它能顯著提升創作者製作高保真、個性化視覺作品的能力，並達到專業級的精準度。

模型具備以下功能：可精細控制虛擬化身的臉部骨骼結構和眼型；提供調色板系統，用於提取和應用一致的配色方案；支援像素級元素操作的精確選框編輯；支援 12 種語言、最多 3000 個詞元的多語言文字渲染；以及在單一輸出中合成最多 12 張圖像的功能。

作為一款旨在處理設計流程各個環節的一體化創意工具，Wan2.7-Image 不僅能夠讓創作者根據文字生成圖像，還能透過同時處理多幅圖像來提高工作效率。它透過簡單易用的指令式編輯功能，為視覺效果帶來精細的調整。在匿名使用者偏好測試中，該模型憑藉著卓越的視覺保真度、精準的文字渲染以及對複雜視覺概念的深刻理解，超越了業界領先的同類產品。

Wan2.7-Image 以深度個人化取代了傳統 AI 的通用標準化外觀。這使用戶能夠微調骨骼結構和眼睛形狀等特定特徵，從而為每個項目打造真正獨特、栩栩如生的角色。它還透過全新的「調色板」功能徹底解決了 AI 色彩渲染的猜測問題：創作者只需在提示框中輸入特定的顏色代碼和比例，即可複製複雜的藝術風格或鎖定精確的品牌顏色，確保每張圖像都完美契合他們的願景或企業準則。

Wan2.7-Image 在文字渲染方面也取得了重大突破，而文字渲染一直是人工智慧領域的一大挑戰。由於能夠處理超長文本序列的長上下文學習框架，Wan2.7-Image 可以處理多達 3000 個字元的文字輸入。該模型支援 12 種語言，能夠產生印刷品質的學術文本、複雜的公式和表格。此外，該模型最多可使用 9 張參考圖像，並一次生成多達 12 張圖像，從而輕鬆創建連貫的故事板、建築渲染圖和電商行銷活動。

目前該系列模型可以在阿里雲人工智慧開發平台 Model Studio 和 Wan 官網存取和部署這些模型。

https://kopyai.com/zh-tw/latest/view/type.news/0/64

Picture Source
Alibaba Cloud

留言

這個網誌中的熱門文章

標普 500 指數和那斯達克指數結束兩週連漲勢頭，人工智慧引發的動盪令科技股承壓

週五美國股市波動劇烈，半導體股在有關 OpenAI ( OPAI.PVT ) IPO 可能推遲的報道出現後回落，這加劇了本週令市場劇烈震蕩的不利因素。科技股為主的那斯達克指數（^IXIC）下跌 0.2%，而標準普爾 500 指數（^GSPC）小幅下跌，這兩個指數本週分別下跌超過 4% 和近 2%。道瓊工業指數（^DJI）科技股佔比較低，跌破橫盤整理線，但周漲幅不到 1%。蘋果公司（ AAPL）上調 MacBook 和 iPad 價格後，人們越來越擔心記憶體和儲存組件成本飆升可能會衝擊設備製造商。內存晶片製造商美光科技（ MU）亮眼的財報表明，這種成本壓力還將繼續。同時，《紐約時報》報道稱，OpenAI 正在考慮將其巨額 IPO 推遲到 2027 年，這也抑制了人們對科技股的興趣。由於市場預期聯準會今年將升息，人工智慧交易已承壓。聯準會首選的通膨指標—個人消費支出指數— —5月份的強勁表現，進一步鞏固了這一預期。 https://kopyai.com/zh-tw/markets/view/type.stock.us/0/165 Picture Source unsplash

閱讀完整內容

西班牙監管機構表示，歐盟數位貨幣監管截止日期不會延長，幣安仍未獲得許可

西班牙最高證券監管機構週五表示，該國不會延長數位貨幣公司根據新規註冊的最後期限——儘管幣安公司正努力完成註冊。根據歐盟新實施的 MiCA 數位貨幣框架，企業必須在 7 月 1 日前在成員國註冊並繼續營運。如果未能在下週前完成註冊，則將強制停止營業。下週後，歐洲消費者將無法與未經授權的數位貨幣服務提供者進行交易。全球最大的數位貨幣交易所幣安曾申請在希臘根據《貨幣與公司法》（MiCA）註冊。但先前有報告指出希臘不太可能批准註冊申請，幣安本周宣布撤回在希臘的申請。目前，幣安正尋求在另一個歐盟成員國註冊，但由於下週三截止日期臨近，幣安很可能被迫至少暫時停止在歐洲的業務運作。根據路透社報道，西班牙國家證券市場委員會主席卡洛斯·聖巴西利奧週五表示，7 月 1 日的最後期限“不會有任何例外或延期”。聖巴西利奧對幣安等大型數位貨幣平台表示擔憂，這些平台由於缺乏 MiCA 合規性，可能在幾天內關閉。他說：“我們擔心的是……過渡期的結束將如何展開，以及人們將如何適應新的環境。” 該監管機構補充說，他和一些人正在與尚未獲得牌照的主要數位貨幣公司聯繫，以確保他們制定計劃將客戶資產轉移到其他提供者，並確保投資者的權利。一旦數位貨幣公司在歐盟國家註冊，其牌照即可「通行」至其他司法管轄區。歐盟成員國在金融監管方面採取了多種不同的方法，從塞浦路斯和馬耳他等較為寬鬆的監管體系，到法國和德國等以監管嚴格著稱的體系，不一而足。雖然每個歐盟國家處理申請的方式可能各不相同，但所有國家都將執行同一套更廣泛的數位貨幣相關規則。 https://kopyai.com/zh-tw/markets/view/type.stock.us/0/166 Picture Source unsplash

閱讀完整內容

DeepSeek-V3.1 發布，邁向 AI Agent

DeepSeek-V3.1 在 DeepSeek-V3.1-Base 的基礎上進行後訓練，後者基於原始 V3 基礎檢查點，通過兩階段長上下文擴展方法構建，遵循原始 DeepSeek-V3 報告中概述的方法。 DeepSeek 透過收集更多長文件並大幅擴展兩個訓練階段來擴展資料集。32K 擴展階段的標記數量增加了 10 倍，達到 6,300 億個標記，而 128K 擴展階段的標記數量增加了 3.3 倍，達到 2,090 億個標記。此外，DeepSeek-V3.1 使用 UE8M0 FP8 規模資料格式進行訓練，以確保與微尺度資料格式相容。 DeepSeek-V3.1 是一個同時支持思考模式和非思考模式的混合模型。相較於上一版本，本次升級帶來了多個方面的改進：混合推理：思考與非思考－一個模型，兩種模式更快的思考：DeepSeek-V3.1-Think 與 DeepSeek-R1-0528 相比，可以在更短的時間內找到答案更強大的代理商技能：後製訓練可提高工具使用率和多步驟代理任務 DeepSeek-V3.1 模型提升了工具使用、程式碼生成和推理效率，在高難度基準測試中實現了與 DeepSeek-R1 相當的效能，同時響應速度更快。它支援結構化工具呼叫、代碼代理和搜尋代理，適用於研究、編碼和代理工作流程。工具和代理程式升級在 SWE / Terminal-Bench 上獲得更好的結果針對複雜搜尋任務的更強大的多步驟推理思考效率大幅提升模型更新 V3.1 基礎：在 V3 基礎上繼續對 840B 個 token 進行預訓練，以進行長上下文擴展 Tokenizer 和聊天範本已更新 - 新的 tokenizer 設定： https://huggingface.co/deepseek-ai/DeepSeek- V3.1/blob/main/tokenizer_config.json V3.1 基礎開源權重： https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base V3.1 開源權重： https://huggingface.co/deepseek-ai/DeepSeek-V3.1 價格變動新定價開始及非高峰折扣結束時間為 2025 年 9 月 5 日 16:00（UTC 時間）在此之前，API 遵循當前定價 ...

閱讀完整內容

Kopy AI Blog

搜尋此網誌