Kopy AI Blog

發表文章

Sakana AI 發布自適應 LLM Transformer²

Sakana AI 發布 Transformer²，這是一個自適應 LLM 模型，主要是透過一種機器學習系統，可以動態調整各種任務的權重，Transformer² 這個名稱反映了它的兩步驟過程：首先，模型分析傳入的任務以了解其要求，然後應用特定於任務的調整來產生最佳結果。 Transformer² 將在測試時動態擴展其運算，以適應它們遇到的任務的複雜性，體現出能夠持續變化和終身學習的生活智慧，並在各種任務（例如數學、編碼、推理和視覺理解）中展示了顯著進步，在效率和特定於任務的表現方面優於 LoRA 等傳統靜態方法，同時需要的參數少得多。 Transformer² 框架設計了一個兩遍適應策略，該策略有效地結合了一組特定於任務的 z 向量。在第一次推理過程中，給定任務或單獨的輸入提示，並使用以下三種適應方法之一分析其測試時間條件。基於提示的適應。專門設計的適應提示對任務進行分類（例如，數學、編碼）並選擇預先訓練的 z 向量。基於分類器的適應。使用 SVF 訓練的任務分類器在推理期間識別任務並選擇適當的 z 向量。少鏡頭適應。透過加權插值組合多個預訓練的 z 向量。一個簡單的最佳化演算法根據幾次評估集的效能來調整這些權重。 https://sakana.ai/transformer-squared/

閱讀完整內容

大語言模型 DeepSeek-V3 發布！

中國 AI 初創公司 DeepSeek 發布其大語言模型 DeepSeek-V3，主要用於處理一系列基於文字的工作負載和任務，例如程式碼、翻譯以及根據描述性提示撰寫論文和電子郵件。根據 DeepSeek 內部的基準測試結果顯示，其性能優於 Meta Llama 3.1 405B、OpenAI 的 GPT-4o、Alibaba Qwen 2.5 72B，在排行榜上名列前茅。目前 DeepSeek-V3 可透過 Hugging Face 取得。 https://www.deepseek.com/?ref=iaperfecta

閱讀完整內容

HC3 和 Apiture 聯手改進銀行業數位報表！

數位銀行解決方案供應商 Apiture 與資料驅動報表提供者 HC3 合作，透過 Apiture 數位銀行平台提供數位化報表，與在郵寄過程中容易被攔截或遺失的紙本報表相比，Apiture 客戶可以利用 HC3 按需啟用個人化且適合行動裝置的報表，從而提高參與度並提高客戶滿意度。 HC3 專門透過提供文件設計、數位交付和列印交付等服務，將金融機構與其客戶聯繫起來，該公司的解決方案旨在幫助銀行和信用合作社增強其品牌影響力，同時簡化報表管理和交付，HC3 的後台管理介面 HC3 Connect 允許金融機構管理客戶服務的系統配置、研究客戶帳戶和文件、審查文件製作作業、審查審計日誌以及存取有關客戶使用情況的各種報告。 https://fintech.global/2024/12/20/hc3-and-apiture-join-forces-to-revolutionise-digital-statements-for-banking/ https://thepaypers.com/online-mobile-banking/apiture-partners-with-hc3-for-digitalised-banking-statements--1271586

閱讀完整內容

Microsoft 發布新的生成式模型 Phi-4！

微軟發布最新的生成式 AI 小語言模型 Phi-4，除了傳統的語言處理之外，還擅長數學等領域的複雜推理，擁有 14B 參數，可以與其他小語言模型 GPT-4o mini、Gemini 2.0 Flash 和 Claude 3.5 Haiku 等競爭，小語言模型 (SLM) 優勢在於執行速度更快、成本更低。 Phi-4 包括高品質合成資料集的使用、高品質有機資料的管理和訓練後創新，在數學相關推理方面優於同類和更大的模型，並且可以和 Azure AI 進行整合，開發人員可以透過單一 API 輕鬆地將這些功能整合到他們的應用程式中。 https://techcommunity.microsoft.com/blog/aiplatformblog/introducing-phi-4-microsoft%E2%80%99s-newest-small-language-model-specializing-in-comple/4357090

閱讀完整內容

阿里巴巴推出 QwQ-32B-Preview AI 推理模型！

阿里巴巴旗下 Qwen Team 發布 QwQ-32B-Preview，包含 320 億參數的開放模型，專為解決高階推理任務而設計，在某些基準測試中甚至超越了 Open AI o1-preview 模型。 QwQ-32B 與其他大多數的模型不同，可以有效地進行自我事實檢查，透過任務進行推理、提前規劃並執行一系列操作來幫助模型梳理出答案，旨在解決現有人工智慧模型在邏輯和抽象推理方面的固有局限性，這對於數學、工程和科學研究等領域至關重要。與其前身不同，QwQ-32B 專注於克服這些基本問題。 QwQ-32B-Preview 是 Qwen Team 開發的實驗研究模型，專注於提升AI推理能力。作為預覽版，它展示了有前途的分析能力，但有幾個重要的限制：語言混合和程式碼切換：模型可能會混合語言或意外地在它們之間切換，從而影響回應清晰度。遞歸推理循環：模型可能會進入循環推理模式，導致冗長的回應而沒有結論性的答案。安全和道德考慮：該模型需要增強的安全措施以確保可靠和安全的性能，用戶在部署它時應謹慎行事。效能和基準限制：該模型在數學和編碼方面表現出色，但在其他領域還有改進的空間，例如常識推理和細緻的語言理解。 https://www.alibabacloud.com/en/solutions/generative-ai/qwen?_p_lc=1

閱讀完整內容

蘋果發布多模態 AI 大語言模型 MM1.5

蘋果發布多模態 AI 大語言模型 MM1.5，目的為加強對文字和圖片的理解，以及多圖片推理能力，這是一個全面增強的版本。 MM1.5 核心升級其創新的資料處理方法，採用以資料為中心的訓練方式，精心選擇並最佳化訓練資料集，MM1.5 結合高清的 OCR 資料和合成影像描述，以及精細的視覺指令調整資料，提高了在文字辨識、圖片理解和視覺指令執行方面的表現。 https://arxiv.org/pdf/2409.20566

閱讀完整內容

阿里雲公開多達 100 種 AI 模型程式碼！

阿里雲開源了 100 多個新推出的 AI 模型，統稱為 Qwen 2.5，新發佈的 Qwen 2.5開源模型參數規模從 5 億到 720 億不等，支援超過 29 種語言，其各項能力均有提升。另外，阿里雲還推出了新版視覺語言模型 Qwen2-VL，能夠理解 20 分鐘以上的影片，並支援影片問答，以及新的 Qwen AI 助手，針對程式設計師自動執行需求分析、程式碼設計和錯誤辨識修復等任務。 https://www.artificialintelligence-news.com/news/alibaba-cloud-unleashes-over-100-open-source-ai-models/

閱讀完整內容