跳到主要內容

發表文章

阿里巴巴推出 QwQ-32B-Preview AI 推理模型!

阿里巴巴旗下 Qwen Team 發布 QwQ-32B-Preview,包含 320 億參數的開放模型,專為解決高階推理任務而設計,在某些基準測試中甚至超越了 Open AI o1-preview 模型。 QwQ-32B 與其他大多數的模型不同,可以有效地進行自我事實檢查,透過任務進行推理、提前規劃並執行一系列操作來幫助模型梳理出答案,旨在解決現有人工智慧模型在邏輯和抽象推理方面的固有局限性,這對於數學、工程和科學研究等領域至關重要。與其前身不同,QwQ-32B 專注於克服這些基本問題。 QwQ-32B-Preview 是 Qwen Team 開發的實驗研究模型,專注於提升AI推理能力。作為預覽版,它展示了有前途的分析能力,但有幾個重要的限制: 語言混合和程式碼切換:模型可能會混合語言或意外地在它們之間切換,從而影響回應清晰度。 遞歸推理循環:模型可能會進入循環推理模式,導致冗長的回應而沒有結論性的答案。 安全和道德考慮:該模型需要增強的安全措施以確保可靠和安全的性能,用戶在部署它時應謹慎行事。 效能和基準限制:該模型在數學和編碼方面表現出色,但在其他領域還有改進的空間,例如常識推理和細緻的語言理解。 https://www.alibabacloud.com/en/solutions/generative-ai/qwen?_p_lc=1

蘋果發布多模態 AI 大語言模型 MM1.5

蘋果發布多模態 AI 大語言模型 MM1.5,目的為加強對文字和圖片的理解,以及多圖片推理能力,這是一個全面增強的版本。 MM1.5 核心升級其創新的資料處理方法,採用以資料為中心的訓練方式,精心選擇並最佳化訓練資料集,MM1.5 結合高清的 OCR 資料和合成影像描述,以及精細的視覺指令調整資料,提高了在文字辨識、圖片理解和視覺指令執行方面的表現。 https://arxiv.org/pdf/2409.20566

阿里雲公開多達 100 種 AI 模型程式碼!

阿里雲開源了 100 多個新推出的 AI 模型,統稱為 Qwen 2.5,新發佈的 Qwen 2.5開 源模型參數規模從 5 億到 720 億不等,支援超過 29 種語言,其各項能力均有提升。 另外,阿里雲還推出了新版視覺語言模型 Qwen2-VL,能夠理解 20 分鐘以上的影片,並支援影片問答,以及新的 Qwen  AI 助手,針對程式設計師自動執行需求分析、程式碼設計和錯誤辨識修復等任務。 https://www.artificialintelligence-news.com/news/alibaba-cloud-unleashes-over-100-open-source-ai-models/

您需要了解的有關 Microsoft Copilot 的一切

Microsoft 365 Copilot 是一種基於大型語言模型和微軟圖形的數據和人工智慧輔助工具,它可以將用戶的自然語言輸入轉化為高效的生產力工具。 Copilot 可以透過點擊 Image Creator 來建立影像,給定文本提示,AI 將生成一組與該提示匹配的圖像,並可以透過第三方應用程式和網站,例如 Instacart (膳食計劃和烹飪相關)、Kayak (旅行)、OpenTable (餐廳預訂) 和 Shopify。 Copilot Pages 是一個可嵌入的數位畫布,為多用戶進行 AI 協作而設的長駐動態介面,使用者可以在其中編輯和分享 Copilot 原創的內容。 https://techcrunch.com/2024/09/16/microsoft-copilot-everything-you-need-to-know-about-microsofts-ai

xAI 憑藉 Colossus 人工智慧訓練系統打破記錄

馬斯克 (Elon Musk) 的 xAI 團隊經過 122 天的時間,已經成功將 Colossus 100k H100 訓練集群上線,並且打破了紀錄。 Colossus 與 Nvidia 合作開發,使用最先進的 GPU 技術,並採用 Nvidia H200 型號進行訓練,Colossus 成為目前最強大的人工智慧訓練系統。 https://www.artificialintelligence-news.com/news/xai-breaks-records-colossus-ai-training-system