跳到主要內容

發表文章

Runway 推出第四代 Gen-4 Turbo 影片 AI 模型,產生速度更快

Runway 週一推出了最近發布的 Gen-4 系列中的新的人工智慧 (AI) 視訊生成模型。最新的 AI 模型被稱為 Gen-4 Turbo,它優先考慮生成速度,同時優化效率。 該人工智慧公司表示,該人工智慧模型將幫助用戶更快地迭代並探索專案的創意願景。 Gen-4 系列的新成員現已在所有付費方案中推出。值得注意的是,新一代視訊 AI 模型在整個場景中提供了更好的角色、位置和物件之間的一致性,以及更好的現實世界物理。 Runway 第四代 Turbo 正式發布 Runway 在 X(原 Twitter)的一篇貼文中表示,最新的 Gen-4 Turbo 大型語言模型(LLM)需要 30 秒才能產生一段 10 秒長的影片。相比之下,標準的 Gen-4 模型可能需要幾分鐘才能產生相同時長的影片。 速度的提升是AI模型的一大亮點,同時也提高了信用效率。根據 Runway網站的訊息,Gen-4 Turbo 每產生一秒的影片會消耗 5 個積分。一段五秒長的影片將消耗 25 個積分,一段十秒長的影片將消耗 50 個積分。相比之下,Gen-4 AI 模型每秒產生影片消耗 12 個積分。 https://kopyai.com/zh-tw/latest/view/type.news/0/27 Picture Source: unsplash

Midjourney V7 首次亮相,具有個性化和改進的影像質量

Midjourney 推出了近一年來首款全新 AI 影像模型 V7,在影像品質和文字提示準確度方面帶來重大提升。 該模型於週四以 alpha 版本推出,其特點是紋理增強、生成主體和物體的連貫性更好,並且具有一個可根據個人用戶自訂結果的新個人化系統。 要存取 V7,用戶必須先對大約 200 張圖片進行評分以建立個人化資料,這是該功能首次預設為啟用。 新款機型有兩個版本:Turbo(產生影像的成本較高)和 Relax(更經濟實惠的選擇)。新的草稿模式還允許使用者以標準模式十倍的速度和一半的成本創建較低品質的影像,並可以選擇稍後對其進行增強。 Midjourney 的一些現有功能(例如影像升級和重新紋理)尚未在 V7 中提供,但預計在兩個月內推出。 Midjourney 仍然是一家獨立的公司,自 2022 年成立以來沒有籌集任何外部資金。據報道,這家總部位於舊金山的公司創造了約 2 億美元的收入,並正在擴展到硬體、視訊和 3D 物件生成領域。 然而,該公司面臨持續的法律挑戰,多起訴訟指控其未經許可使用受版權保護的圖像來訓練其人工智慧模型。 https://kopyai.com/zh-tw/latest/view/type.news/0/26 Picture Source: dig.watch

亞馬遜的 Alexa 基金正在支持人工智慧新創公司

亞馬遜於 2015 年成立了 Alexa 基金,以支援早期語音新創公司。隨著大型語言模型的出現以及亞馬遜推出由 Gen AI 驅動的 Alexa + 以及一系列多模式 AI 模型,該基金現在希望擴大其範圍並向 AI 新創公司投入更多資金。 在亞馬遜與 TechCrunch 分享的一篇部落格文章中,Alexa Fund 負責人 Paul Bernard 解釋說,該公司現在希望投資包括人工智慧硬體和智慧代理在內的領域。 伯納德表示:“雖然多年來 Alexa 基金的使命已經不再局限於最初專注於語音技術,但人工智慧的快速發展為我們帶來了一個轉折點,讓基金能夠擁抱新技術,同時仍然履行其最初的使命。” 「因此,該基金一直在投資那些推動人工智慧硬體、生成媒體、智慧代理、新興人工智慧架構等領域發展的新創公司。為了深入了解這一不斷發展的投資策略,我們與 Alexa 基金的主管 Paul Bernard 進行了會面,向他詢問了該基金的新使命及其最近的投資。” 該基金已投資了四家從事不同領域的新創公司: NinjaTech AI:這是一家一體化人工智慧公司,其聊天機器人可以生成程式碼、圖像和視頻,進行深入研究並為您安排會議。就像 Quora 的 Poe 等 AI 助理平台一樣,NinjaTech AI 可以存取 OpenAI、Meta、Anthropic、Google 和 DeepSeek 的模型。亞馬遜表示,該公司在 AWS 上運行其基礎設施。 Hedra: Hedra 是一家 AI 媒體公司,允許用戶透過其工作室產生圖像、音訊和視訊。該公司最近推出了用於各種形式的內容創作的Character-3 AI。去年,該公司從 a16z Games Speedrun、Abstract 和 Index Ventures 籌集了 1,000 萬美元。 Ario:Ario 是一款人工智慧家庭管理應用程序,用於處理日程安排和任務。該公司創建了一個學校電子郵件解碼器,透過學校通訊來創建事件和行動項目。伯納德說,這款應用程式給他留下了深刻的印象,因為它了解任務背後的個人背景。值得注意的是,Hearth Display和Maple等新創公司也致力於解決家庭日程管理問題。 HeyBoss:在網路上很難逃避「氛圍編碼」這個短語,特別是如果你關注科技的話。 HeyBoss 是同一類別的新創公司,它允許您透過描述來...

Google 發布最聰明的 AI 模型 Gemini 2.5!

今天,我們推出最聰明的 AI 模型 Gemini 2.5。我們的第一個 2.5 版本是 2.5 Pro 的實驗版本,它在廣泛的基準測試中都處於領先地位,並且在LMArena上以顯著優勢排名第一。 Gemini 2.5 模型是思考模型,能夠在做出反應之前透過自己的想法進行推理,從而提高性能和準確性。 在人工智慧領域,系統的「推理」能力不僅僅指分類和預測。它指的是分析資訊、得出合乎邏輯的結論、結合背景和細微差別並做出明智決策的能力。 長期以來,我們一直在探索透過強化學習、思路鏈提示等技術,讓人工智慧變得更聰明、更推理能力。在此基礎上,我們最近推出了我們的第一個思維模型,Gemini 2.0 Flash Thinking。 現在,借助 Gemini 2.5,我們透過結合顯著增強的基礎模型和改進的後期訓練,實現了全新的性能水準。展望未來,我們將把這些思考能力直接融入我們的所有模型中,以便它們能夠處理更複雜的問題,並支援更強大、更具情境感知能力的代理。 Gemini 2.5 Pro 簡介 Gemini 2.5 Pro Experimental 是我們用來執行複雜任務的最先進的模型。它在LMArena排行榜(衡量人類偏好)上以顯著優勢名列前茅,表明該模型性能強大,且具有高品質的風格。 2.5 Pro也表現出強大的推理和編碼能力,在常見的編碼、數學和科學基準測試中處於領先地位。 Gemini 2.5 Pro 現已在Google AI Studio和Gemini 應用程式中針對 Gemini Advanced 用戶推出,並且即將在Vertex AI中推出。我們還將在未來幾週內推出定價,讓人們能夠使用具有更高速率限制的 2.5 Pro 進行規模生產使用。 增強推理 Gemini 2.5 Pro 在一系列需要高階推理的基準測試中都處於領先地位。 2.5 Pro 不使用會增加成本的測試時間技術(如多數投票),在 GPQA 和 AIME 2025 等數學和科學基準測試中處於領先地位。 在「人類的最後考試」中,它在未使用工具的模型中也獲得了 18.8% 的最高分數,這是最先進的成績。 「人類的最後考試」是一個由數百名學科專家設計的資料集,旨在捕捉人類知識和推理的前沿。 進階編碼 我們一直專注於程式設計效能,Gemini 2.5 較 2.0 有了很大的飛躍——未來還會有更多的改進。 2.5 P...

加密貨幣與 SEC 的長期鬥爭隨著 Ripple 的勝利而結束

美國證券交易委員會多年來針對加密貨幣產業的討伐似乎已經結束。 最終篇章於週三落下帷幕,當時 Ripple宣布美國證券交易委員會 (SEC) 已正式撤銷針對該公司長達四年的訴訟。該訴訟是在傑伊·克萊頓 (Jay Clayton) 擔任美國證券交易委員會 (SEC) 主席的最後一天提起的,指控 Ripple 通過出售其 XRP 代幣籌集了 13 億美元, 但並未將其註冊為證券。 加密貨幣公司和交易所 Coinbase、Kraken、羅賓漢、幣安和 OpenSea 先前均遭遇過訴訟或調查被撤銷、解決或擱置。 Ripple 目前正在慶祝勝利。 Ripple 首席法律官 Stuart Alderoty 在透過電子郵件向 CNBC 表示:“Ripple 是唯一一家奮起反擊並在關鍵法律問題上取得勝利的公司,這給美國證券交易委員會通過執法摧毀美國加密貨幣的計劃造成了重大阻礙。” 「SEC 現在已經放棄了對我們案件的上訴。諷刺的是,Ripple 是他們提起的第一起重大案件,而現在將是他們放棄的最後一起案件。” XRP 於 2012 年創建,是首批非比特幣加密貨幣之一。它由 Ripple 公司創始人創立,並成為該平台的本土貨幣。與比特幣一樣,XRP 可以由散戶投資者購買和出售。XRP 在周三宣布這一消息後,該股上漲了約 11%。 Ripple 斥資 1.5 億美元與政府展開激烈的法律對峙,對手是前美國證券交易委員會主席 Gary Gensler,而後者對加密貨幣的態度被廣泛視為敵對的。  2023 年 7 月,一名聯邦法官裁定 XRP  “從表面上看不一定是一種證券”, 這削弱了 SEC 案件的基礎。 https://kopyai.com/zh-tw/markets/view/type.stock.us/0/44 Picture Source: pixabay

1X 將於 2025 年在數百個家庭中測試人形機器人

  根據該公司執行長 Bernt Børnich 介紹,挪威機器人新創公司 1X 計劃在 2025 年底前在「幾百到幾千個」家庭中開始對其人形機器人 Neo Gamma 進行早期測試。 「Neo Gamma 今年將進入家庭,」Børnich 在 Nvidia GTC 2025 的一次採訪中告訴 TechCrunch。 最近幾個月,家用人形機器人的炒作似乎達到了新的高度。 Figure 是 1X 的競爭對手,總部位於灣區,在社群媒體上活躍。數週後,彭博社報道稱,Figure 正在洽談以令人瞠目結舌的 400 億美元估值籌集 15 億美元資金。據報道,1X 投資者 OpenAI 也正在探索打造自己的人形機器人。 但將重金屬機器人放入人們的家中則會增加這個新興產業的風險。這與自動駕駛汽車新創公司將其機器人計程車投入道路並無不同。它可以迅速地轉向南。 然而,Børnich 非常坦誠地承認 Neo Gamma 距離商業規模化和自主化還有很長的路要走。 雖然 Neo Gamma 使用人工智慧來行走和保持平衡,但該機器人目前還無法完全實現自主移動。為了實現家庭測試,Børnich 表示 1X 正在透過依靠遠端操作員(遠端位置的人類可以即時查看 Neo Gamma 的攝影機和感測器並控制它的肢體)來「引導整個過程」。 這些家庭測試將允許 1X 收集有關 Neo Gamma 在家中如何運作的數據。早期採用者將協助創建一個大型、有價值的資料集,1X 可以使用該資料集訓練內部 AI 模型並升級 Neo Gamma 的功能。 https://kopyai.com/zh-tw/latest/view/type.news/0/23 Picture Source: 1x.tech

OpenAI 的新語音 AI 模型 gpt-4o-transcribe 可讓您在幾秒鐘內將語音新增至現有文字應用

OpenAI 的語音 AI 模型之前曾給演員斯嘉麗約翰遜帶來麻煩,但這並沒有阻止該公司繼續推進其在這一類別的產品。 今天,ChatGPT 製造商推出了三種新的專有語音模型:gpt-4o-transcribe、gpt-4o-mini-transcribe 和 gpt-4o-mini-tts。這些模型最初將透過 ChatGPT 製造商的應用程式介面 (API) 提供,供第三方軟體開發人員建立自己的應用程式。它們也將在自訂演示網站 OpenAI.fm上提供,個人用戶可以訪問該網站進行有限的測試和娛樂。 此外,可以透過文字提示從幾個預設中自訂 GPT-4O-MINI-TTS 模型聲音,以改變其口音、音調、聲調和其他聲音特質——包括傳達用戶要求的任何情緒,這在很大程度上解決了 OpenAI 故意模仿任何特定用戶聲音的擔憂(該公司之前否認約翰遜的情況,但無論如何還是取消了表面上模仿的聲音選項)。現在,用戶可以決定他們希望 AI 語音回覆時的聲音效果。 在與 VentureBeat 透過視訊通話進行的演示中,OpenAI 技術人員 Jeff Harris 展示瞭如何僅使用演示網站上的文本,用戶可以讓相同的聲音聽起來像咯咯笑的瘋狂科學家或禪宗、平靜的瑜伽老師。 https://kopyai.com/zh-tw/latest/view/type.news/0/22 Picture Source: pixabay