电竞比分网-中国电竞赛事及体育赛事平台

關于ZAKER 合作
Techmeme 4小時前

微軟發(fā)布低成本圖像生成模型 MAI-Image-2-Efficient,加速 AI 自研戰(zhàn)略

微軟今日正式推出其旗艦文本生成圖像模型的低成本變體——MAI-Image-2-Efficient。這款新模型以幾乎一半的價格提供生產(chǎn)級質(zhì)量,并在微軟 FoundryMAI Playground平臺上線,無需等待名單。

新模型定價為每百萬文本輸入令牌 5 美元,每百萬圖像輸出令牌 19.5 美元,相比原版 MAI-Image-2 價格下降約 41%。據(jù)微軟稱,該模型運行速度比旗艦版本快 22%,在 NVIDIA H100 硬件上吞吐效率提升 4 倍,且在延遲測試中平均比谷歌 Gemini 系列模型快 40%。

微軟表示,MAI-Image-2-Efficient 將率先集成至Copilot必應,未來還將覆蓋更多產(chǎn)品線。

雙模型策略滿足多樣化需求

微軟將 MAI-Image-2-Efficient 定位為高容量、成本敏感場景的理想選擇,適用于產(chǎn)品攝影、營銷創(chuàng)意、UI 設計等任務。而旗艦版 MAI-Image-2 則專注于高質(zhì)量需求,如照片寫實、復雜風格化及長文本排版。這種分層策略借鑒了 OpenAI、Anthropic 等行業(yè)領先者的定價模式,但專門針對圖像生成領域優(yōu)化。

快速迭代背后的戰(zhàn)略意圖

此次發(fā)布的節(jié)奏尤為引人注目。MAI-Image-2 于今年 3 月 19 日剛剛亮相,不到一個月時間,微軟便推出了優(yōu)化版本。這體現(xiàn)了由微軟 AI 首席執(zhí)行官 Mustafa Suleyman 領導的 MAI 超級智能團隊的高效運作方式,更像是初創(chuàng)公司而非傳統(tǒng)研究實驗室。

外界對 MAI-Image-2 的早期反響積極。Decrypt 評測顯示,該模型在 Arena.ai 排行榜上位列第三,僅次于谷歌和 OpenAI。盡管如此,原始版本仍存在諸多限制,例如生成冷卻時間、每日圖片數(shù)量上限以及寬高比單一等問題。目前尚不清楚新版本是否解決了這些問題。

與 OpenAI 關系破裂推動內(nèi)部模型發(fā)展

此次發(fā)布正值微軟與 OpenAI 合作關系逐漸瓦解之際。根據(jù) CNBC 報道,OpenAI 新任首席營收官 Denise Dresser 在內(nèi)部備忘錄中直言,與微軟的合作 " 限制了滿足企業(yè)需求的能力 "。與此同時,微軟已在 2024 年年報中將 OpenAI 列為競爭對手。

MAI 模型家族成為微軟擺脫對 OpenAI 依賴的關鍵一步。通過以更低的成本提供高質(zhì)量圖像生成能力,微軟正在逐步將原本流向 OpenAI 的收入轉移至自身。

廉價高效的圖像生成助力 AI 代理崛起

隨著 AI 代理技術的興起,圖像生成正從獨立工具轉變?yōu)樽詣踊ぷ髁鞯囊徊糠帧N④浾陂_發(fā)多款 Copilot 相關代理功能,預計將在六月的 Build 大會上展示。這些代理需要快速且經(jīng)濟的圖像生成能力,而 MAI-Image-2-Efficient 正是為此量身打造。

未解問題與未來展望

盡管此次發(fā)布亮點頗多,但仍有一些關鍵問題懸而未決,例如新模型是否解決了寬高比限制和內(nèi)容過濾過于嚴格的問題。此外,效率數(shù)據(jù)基于特定測試條件,實際表現(xiàn)可能因使用場景而異。

不過,微軟在過去五個月內(nèi)接連推出多個基礎模型和優(yōu)化版本,展現(xiàn)出強大的研發(fā)能力和戰(zhàn)略執(zhí)行力。對于一家曾長期依賴合作伙伴技術的公司而言,微軟正以全新的姿態(tài)重新定義自身在生成式 AI 領域的地位。

相關閱讀

最新評論

沒有更多評論了

覺得文章不錯,微信掃描分享好友

掃碼分享

企業(yè)資訊

查看更多內(nèi)容