跳到主要內容

發表文章

Sakana AI 發布自適應 LLM Transformer²

Sakana AI 發布 Transformer²,這是一個 自適應 LLM 模型,主要是透過一種機器學習系統,可以動態調整各種任務的權重,Transformer² 這個名稱反映了它的兩步驟過程:首先,模型分析傳入的任務以了解其要求,然後應用特定於任務的調整來產生最佳結果。 Transformer² 將在測試時動態擴展其運算,以適應它們遇到的任務的複雜性,體現出能夠持續變化和終身學習的生活智慧,並在各種任務(例如數學、編碼、推理和視覺理解)中展示了顯著進步,在效率和特定於任務的表現方面優於 LoRA 等傳統靜態方法,同時需要的參數少得多。 Transformer² 框架設計了一個兩遍適應策略,該策略有效地結合了一組特定於任務的 z 向量。在第一次推理過程中,給定任務或單獨的輸入提示,並使用以下三種適應方法之一分析其測試時間條件。 基於提示的適應。專門設計的適應提示對任務進行分類(例如,數學、編碼)並選擇預先訓練的 z 向量。 基於分類器的適應。使用 SVF 訓練的任務分類器在推理期間識別任務並選擇適當的 z 向量。 少鏡頭適應。透過加權插值組合多個預訓練的 z 向量。一個簡單的最佳化演算法根據幾次評估集的效能來調整這些權重。 https://sakana.ai/transformer-squared/

大語言模型 DeepSeek-V3 發布!

中國 AI 初創公司 DeepSeek 發布其大語言模型 DeepSeek-V3,主要用於處理一系列基於文字的工作負載和任務,例如程式碼、翻譯以及根據描述性提示撰寫論文和電子郵件。 根據 DeepSeek  內部的基準測試結果顯示,其性能優於 Meta Llama 3.1 405B、OpenAI 的 GPT-4o、Alibaba Qwen 2.5 72B,在排行榜上名列前茅。 目前 DeepSeek-V3 可透過 Hugging Face 取得。 https://www.deepseek.com/?ref=iaperfecta

HC3 和 Apiture 聯手改進銀行業數位報表!

數位銀行解決方案供應商 Apiture 與資料驅動報表提供者 HC3 合作,透過 Apiture 數位銀行平台提供數位化報表,與在郵寄過程中容易被攔截或遺失的紙本報表相比,Apiture 客戶可以利用 HC3 按需啟用個人化且適合行動裝置的報表,從而提高參與度並提高客戶滿意度。 HC3 專門透過提供文件設計、數位交付和列印交付等服務,將金融機構與其客戶聯繫起來,該公司的解決方案旨在幫助銀行和信用合作社增強其品牌影響力,同時簡化報表管理和交付,HC3 的後台管理介面 HC3 Connect 允許金融機構管理客戶服務的系統配置、研究客戶帳戶和文件、審查文件製作作業、審查審計日誌以及存取有關客戶使用情況的各種報告。 https://fintech.global/2024/12/20/hc3-and-apiture-join-forces-to-revolutionise-digital-statements-for-banking/ https://thepaypers.com/online-mobile-banking/apiture-partners-with-hc3-for-digitalised-banking-statements--1271586

Microsoft 發布新的生成式模型 Phi-4!

  微軟發布最新的生成式 AI 小語言模型 Phi-4,除了傳統的語言處理之外,還擅長數學等領域的複雜推理,擁有 14B 參數,可以與其他小語言模型 GPT-4o mini、Gemini 2.0 Flash 和 Claude 3.5 Haiku 等競爭,小語言模型 (SLM) 優勢在於執行速度更快、成本更低。 Phi-4 包括高品質合成資料集的使用、高品質有機資料的管理和訓練後創新,在數學相關推理方面優於同類和更大的模型,並且可以和 Azure AI 進行整合,開發人員可以透過單一 API 輕鬆地將這些功能整合到他們的應用程式中。 https://techcommunity.microsoft.com/blog/aiplatformblog/introducing-phi-4-microsoft%E2%80%99s-newest-small-language-model-specializing-in-comple/4357090

阿里巴巴推出 QwQ-32B-Preview AI 推理模型!

阿里巴巴旗下 Qwen Team 發布 QwQ-32B-Preview,包含 320 億參數的開放模型,專為解決高階推理任務而設計,在某些基準測試中甚至超越了 Open AI o1-preview 模型。 QwQ-32B 與其他大多數的模型不同,可以有效地進行自我事實檢查,透過任務進行推理、提前規劃並執行一系列操作來幫助模型梳理出答案,旨在解決現有人工智慧模型在邏輯和抽象推理方面的固有局限性,這對於數學、工程和科學研究等領域至關重要。與其前身不同,QwQ-32B 專注於克服這些基本問題。 QwQ-32B-Preview 是 Qwen Team 開發的實驗研究模型,專注於提升AI推理能力。作為預覽版,它展示了有前途的分析能力,但有幾個重要的限制: 語言混合和程式碼切換:模型可能會混合語言或意外地在它們之間切換,從而影響回應清晰度。 遞歸推理循環:模型可能會進入循環推理模式,導致冗長的回應而沒有結論性的答案。 安全和道德考慮:該模型需要增強的安全措施以確保可靠和安全的性能,用戶在部署它時應謹慎行事。 效能和基準限制:該模型在數學和編碼方面表現出色,但在其他領域還有改進的空間,例如常識推理和細緻的語言理解。 https://www.alibabacloud.com/en/solutions/generative-ai/qwen?_p_lc=1

蘋果發布多模態 AI 大語言模型 MM1.5

蘋果發布多模態 AI 大語言模型 MM1.5,目的為加強對文字和圖片的理解,以及多圖片推理能力,這是一個全面增強的版本。 MM1.5 核心升級其創新的資料處理方法,採用以資料為中心的訓練方式,精心選擇並最佳化訓練資料集,MM1.5 結合高清的 OCR 資料和合成影像描述,以及精細的視覺指令調整資料,提高了在文字辨識、圖片理解和視覺指令執行方面的表現。 https://arxiv.org/pdf/2409.20566

阿里雲公開多達 100 種 AI 模型程式碼!

阿里雲開源了 100 多個新推出的 AI 模型,統稱為 Qwen 2.5,新發佈的 Qwen 2.5開 源模型參數規模從 5 億到 720 億不等,支援超過 29 種語言,其各項能力均有提升。 另外,阿里雲還推出了新版視覺語言模型 Qwen2-VL,能夠理解 20 分鐘以上的影片,並支援影片問答,以及新的 Qwen  AI 助手,針對程式設計師自動執行需求分析、程式碼設計和錯誤辨識修復等任務。 https://www.artificialintelligence-news.com/news/alibaba-cloud-unleashes-over-100-open-source-ai-models/