中國

阿里巴巴發布AI模型聲稱超越DeepSeek

2025年1月29日

美國之音

嵌入

阿里巴巴發佈AI模型聲稱其超越DeepSeek

No media source currently available

0:00 0:01:01 0:00

阿里巴巴發佈AI模型聲稱其超越DeepSeek

華盛頓 —

嵌入

阿里巴巴發布AI模型聲稱超越DeepSeek

by 美國之音

No media source currently available

0:00 0:01:39 0:00

中國科技公司阿里巴巴星期三(1月29日)發布了其通義千問「Qwen 2.5」人工智能AI)模型的新版本，並聲稱該模型已超越備受讚譽的DeepSeek-V3。

阿里雲發布其全新的通義千問 Qwen 2.5-Max超大規模混合專家(MoE)模型的時間較不尋常，正值農曆新年第一天，大多數中國人正在放假與家人團聚。這意味著中國AI新創公司深度求索(DeepSeek)過去三週的迅猛崛起，不僅給海外競爭對手、也給國內競爭者帶來了壓力。

「Qwen 2.5-Max…幾乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B，」阿里雲在微信公眾號上發布的一篇公告中說，其指的分別是OpenAI、深度求索和Meta最先進的開源AI模型。

根據介紹，Qwen 2.5-Max使用超過20兆token(AI模型處理的資料單位)的預訓練資料及精心設計的後訓練方案進行訓練。

阿里雲說，通義團隊分別對Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本效能進行了評估測試。在指令模型測試方面，Qwen2.5-Max在多個基準測試中比肩美國的Claude-3.5-Sonnet模型，幾乎全面超越了另外三個美國模型GPT-4o、DeepSeek-V3及Llama-3.1-405B 。

阿里雲表示，在基座模型測試方面，通義團隊將Qwen2.5-Max與目前DeepSeek V3、Llama-3.1-405B、Qwen2.5-72B進行了對比，而Qwen2.5-Max在所有11項基準測試中全部超越了對比模型。

不過，微信公眾號「簡約財經」的貼文指出，Qwen 2.5-Max 在發展過程中仍面臨著許多挑戰和風險，其中包括在技術挑戰方面，訓練優化過程中的計算資源消耗和時間成本問題，以及模型在複雜任務和多模態融合方面的表現提升需求，都需要進一步的研究和創新來解決。

這篇文章說，在倫理與安全風險方面，Qwen 2.5-Max也面臨資料隱私保護、模型偏見避免以及內容真實性和 AI 濫用防範等需要高度重視的問題。

DeepSeek與國內競爭對手

深度求索1月10日發布了其DeepSeek-V3模型驅動的AI助手，隨後在1月20日推出R1模型。這一系列AI模型的新發布震撼了矽谷，並導致科技股重挫。深度求索據稱低廉的開發和使用成本，促使投資者開始質疑美國領先AI公司的巨額支出計劃。

深度求索的成功也引發了國內競爭對手競相升級本身的AI模型。

在DeepSeek-R1發布兩天后，TikTok母公司字節跳動推出了其旗艦AI模型的更新，並聲稱該模型在AIME(旨在衡量AI模型對複雜指令的理解和回應能力的一項基準測試)中的表現優於微軟支援的OpenAI的o1模型。

這與深度求索的說法相似。深度求索聲稱其R1模型在多個性能基準測試中可比得上OpenAI的o1。

DeepSeek-V3模型的前身DeepSeek-V2在去年5月發布後，引發了中國AI模型的價格戰。

DeepSeek-V2採用開源和空前低廉的價格(每百萬個tokens僅需1元人民幣)，導致阿里雲宣布對一系列模型的降價幅度最高達97%。

其他中國科技公司紛紛跟進，包括百度(2023年3月發布中國首個類同於ChatGPT的產品)以及中國市值最高的互聯網公司騰訊。

深度求索的神秘創始人梁文鋒在去年7月接受中國媒體《暗湧》(Waves)的罕見採訪中表示，該公司「不在乎」價格戰，其主要目標是實現AGI(通用人工智慧)。

OpenAI將AGI定義為能夠在大多數具有經濟價值的任務上超越人類的自主系統。

相較於阿里巴巴等中國大型科技公司擁有數十萬名員工，深度求索的運作方式像是研究實驗室，其團隊主要由來自中國頂尖大學的年輕畢業生和博士生組成。

梁文鋒在去年7月的訪談中表示，他認為中國大型科技公司可能不太適合未來的AI產業，並將這些企業的高成本和自上而下的架構，與深度求索採用的精簡營運和寬鬆管理的風格，進行了對比。

「大型基礎模型需要持續創新，科技巨頭的能力是有限的，」他說。

（本文主要依據了路透社的報導。）

特別報導

一帶一路的延伸

2023年是習近平提出的“一帶一路”倡議10週年。中國已投入萬億美元，在世界各地建設基礎設施項目。自倡議首次提出以來，習近平進一步擴大“一帶一路”項目的範圍，以覆蓋醫療、教育和技術等領域。

港聞

嵌入

VOA國際60秒：2025年3月13日

Auto
240p
360p
480p
720p
1080p

No media source currently available

0:00 0:01:00 0:00

Auto
240p
360p
480p
720p
1080p

阿里巴巴發布AI模型聲稱超越DeepSeek

阿里巴巴發佈AI模型聲稱其超越DeepSeek

阿里巴巴發布AI模型聲稱超越DeepSeek

DeepSeek與國內競爭對手

相關內容

真相與中國DeepSeek人工智能的宣傳和審查進行抗爭

DeepSeek 震撼矽谷和華爾街但內容審查恐令其在國際市場遇到挑戰

DeepSeek震撼減弱全球市場穩定納指反彈強勁

DeepSeek被發現不敢觸及六四等扭曲敏感話題

特朗普警告：低成本中國AI為矽谷敲響警鐘

美國AI公司試圖破解DeepSeek破壞性創新技術

DeepSeek橫空出世美中AI競爭會迎來根本改變嗎？

特別報導

一帶一路的延伸

港聞

學者評論北京兩會不滿愛國者治港立法會議員表現不濟

抗議現場呼籲警方克制的香港社工陳虹秀“暴動”案重審被判罪成

黎智英兒子求見英國首相指英中改善關係前提應是釋放黎智英

最新視頻

VOA國際60秒：2025年3月13日

VOA國際60秒：2025年3月13日

七天以來最受關注內容

G7外長聲明涉台措辭不再提 “一個中國” 中方批評干涉內政

為維護國家安全特朗普政府考慮對40多國實施簽證禁限制措施

路透：美國在台協會政治組長獲任命駐北京大使館臨時代辦

伊拉克：伊斯蘭國一重要領導人被打死

克里姆林宮：有理由對停火協議感到樂觀

無障礙鏈接

關注我們

阿里巴巴發布AI模型 聲稱超越DeepSeek

阿里巴巴發佈AI模型 聲稱其超越DeepSeek

阿里巴巴發布AI模型 聲稱超越DeepSeek

DeepSeek與國內競爭對手

相關內容

真相與中國DeepSeek人工智能的宣傳和審查進行抗爭

DeepSeek 震撼矽谷和華爾街 但內容審查恐令其在國際市場遇到挑戰

DeepSeek震撼減弱全球市場穩定納指反彈強勁

DeepSeek被發現不敢觸及六四等扭曲敏感話題

特朗普警告：低成本中國AI為矽谷敲響警鐘

美國AI公司試圖破解DeepSeek破壞性創新技術

DeepSeek橫空出世 美中AI競爭會迎來根本改變嗎？

特別報導

一帶一路的延伸

港聞

學者評論北京兩會不滿愛國者治港立法會議員表現不濟

抗議現場呼籲警方克制的香港社工陳虹秀“暴動”案重審被判罪成

黎智英兒子求見英國首相 指英中改善關係前提應是釋放黎智英

最新視頻

VOA國際60秒：2025年3月13日

VOA國際60秒：2025年3月13日

七天以來最受關注內容

G7外長聲明涉台措辭不再提 “一個中國” 中方批評干涉內政

為維護國家安全 特朗普政府考慮對40多國實施簽證禁限制措施

路透：美國在台協會政治組長獲任命駐北京大使館臨時代辦

伊拉克：伊斯蘭國一重要領導人被打死

克里姆林宮：有理由對停火協議感到樂觀

阿里巴巴發布AI模型聲稱超越DeepSeek

阿里巴巴發佈AI模型聲稱其超越DeepSeek

阿里巴巴發布AI模型聲稱超越DeepSeek

DeepSeek 震撼矽谷和華爾街但內容審查恐令其在國際市場遇到挑戰

DeepSeek橫空出世美中AI競爭會迎來根本改變嗎？

黎智英兒子求見英國首相指英中改善關係前提應是釋放黎智英

為維護國家安全特朗普政府考慮對40多國實施簽證禁限制措施