近年來,大型語言模型(LLM)已成為人工智慧領域的核心技術,各國企業無不投入巨資開發更強大的AI。在這場競爭中,中國推出Deepseek(深度求索),以「遠低於主流AI模型的成本,實現同等級效能」為賣點,引發全球熱議。
然而,隨著關注度升高,Deepseek 面臨越來越多爭議,包括開發成本是否被刻意低估、使用蒸餾技術(Model Distillation)濫用Open AI模型、疑似盜取Nvidia高端AI晶片、資安與智慧財產權等問題,導致全球陸續開始調查或發布禁令。
此外,Deepseek技術確實有助於降低語言模型運行成本,但是否真正達成技術性革命,也引發大量討論。業界認為,它在本質上並非LLM的突破性創新,而是改善成本與運算效率。
本篇統整現行相關資訊及爭議,讓AI產業以外的大眾,也能一起加入這場AI辯論。
本文章節
LLM是什麼?為什麼「門檻很高」?
語言模型的基本概念
訓練需求與成本
如何才能算得上「AI的革新」?
認識Deepseek
定義與特色
Deepseek vs 主流AI模型
Deepseek的爭議與隱憂
爭議1:並非真正的AI創新,而是「技術壓縮」
爭議2:資訊安全與資料回傳問題
爭議3:內容及審查機制缺乏透明度,難以信任
爭議4:OpenAI控訴其透過「模型蒸餾」技術,侵犯知識產權
爭議5:美國Scale AI質疑其盜用禁止向中國出口的NvidiaH100晶片
爭議6:是否誇大訓練的成本效益
Deepseek現面臨哪些全球禁令?
![](https://static.wixstatic.com/media/a083ae_f979f9f0827b41e4aaae37907b29a5eb~mv2.png/v1/fill/w_980,h_551,al_c,q_90,usm_0.66_1.00_0.01,enc_auto/a083ae_f979f9f0827b41e4aaae37907b29a5eb~mv2.png)
LLM是什麼?為什麼「門檻很高」?
基本概念
大型語言模型(Large Language Model,LLM)是人工智慧(AI)發展的核心技術之一。
簡單來說,LLM是一種基於深度學習(Deep Learning)和變換器架構(Transformer Architecture)的神經網路,它能夠自動理解並生成類似人類的自然語言。
這類模型的基礎是龐大的訓練數據,包含:
來自網路的大量文本與資料
透過自監督學習(Self-supervised Learning)讓模型學習語言結構
邏輯推理和資訊檢索能力
著名的LLM包括OpenAI的GPT-4、Google的Gemini、Meta的Llama系列等。
訓練需求與成本
據估計,GPT-4的訓練成本超過數億美元,這也是許多企業無法輕易開發自己LLM的原因。
訓練一個LLM涉及大量的計算資源,主要成本來源包括:
數據處理(Data Processing)
需要收集、整理並過濾高品質的語料。
算力基礎設施(Computational Infrastructure)
通常使用數千張GPU(Graphics Processing Unit,圖形處理單元)或TPU(Tensor Processing Unit,張量處理單元)來進行訓練。
電力與冷卻(Electricity & Cooling)
運行高性能運算設備需要消耗大量電力,並需要專門的冷卻技術。
專業人力與研究(Human Expertise)
頂尖的AI研究人員、工程師和數據科學家需要進行參數調整(Hyperparameter Tuning)和架構優化。
如何才能算得上「AI的革新」?
當談論AI技術的「突破」時,我們通常指的是綜合以下方面,而不只是提高訓練速度、壓縮計算需求、降低算力成本等等。
模型架構創新(Architectural Innovations)
例如Google提出的Transformer架構,改變了AI的發展。
訓練方法的進步(Training Methodology Improvements)
例如少樣本學習(Few-shot Learning)、自監督學習等方法。
推理能力增強(Reasoning Capabilities)
模型是否能夠更好地理解上下文、回答問題甚至進行邏輯推理。
資源優化與效能提升(Resource Optimization & Performance Boost)
降低計算成本,提高模型的可擴展性。
Deepseek:是AI技術革命,還是讓人失望的「壓縮」與「蒸餾」?
認識 Deepseek
Deepseek(深度求索)是中國近期推出的人工智慧系統,包括DeepSeek-V3和DeepSeek-R1等模型,主打「高效能且低成本的語言模型,可推進通用人工智慧(AGI)」。
技術重點
最初,其宣稱達成「革命性」的AI發展,實際上,它的技術重點並不在於LLM本身的創新,而是如何降低LLM的訓練成本與推理效能。
硬體及運行成本
據調查,DeepSeek母公司幻方量化(High-Flyer)Deepseek在2022年美國禁止NVIDIA對中國出售高端AI晶片(NVIDIA H100)前,便已經購入大量較舊的NVIDIA A100加速器,因此硬體成本較低。
訓練成本效益高
Deepseek表示,其模型在性能上比肩OpenAI,訓練成本卻顯著降低,可以不到600萬美元的成本完成訓練,比起其他競爭對手需要1億美元以上的投入更划算。
特色 | Deepseek AI | GPT-4 (OpenAI) | Gemini (Google) | Llama 3 (Meta) |
模型類型 | 訓練優化型AI | 通用大型語言模型 | 多模態(文本+圖像) | 開放權限的LLM |
核心技術 | 訓練加速與壓縮 | 變換器架構 | 多模態學習 | 高效能低資源需求 |
主要用途 | 降低成本,提高推理速度 | 高度智慧化對話、內容生成 | 視覺+文本理解 | 企業應用與開發者社群 |
資料來源 | 未公開 | 多語言網頁與書籍 | 圖像+文本資料 | 開源數據 |
隱私與資安 | 爭議較大 | 隱私政策明確 | 強調資料安全 | 社群監督 |
Deepseek的爭議與隱憂
爭議1:並非真正的AI創新,而是「技術壓縮」
目前業界分析,Deepseek 的核心技術並非新一代的語言模型,而是透過壓縮演算法(Compression Algorithms)加速LLM的訓練與推理。
這樣的技術雖然對於降低成本有幫助,但並未帶來AI推理能力的突破,因此將其稱為「革命性創新」顯然有誤導成分。
這就像是一家車廠聲稱「發明了新一代的電動車」,但其技術實際上是讓傳統燃油車更加省油,並未改變動力系統的核心架構。
爭議2:資訊安全與資料回傳問題
DeepSeek的隱私政策明確指出,會將所有使用者數據回傳儲存至中國,引發各國對於數據安全和隱私的擔憂,尤其考量到中國政府對企業數據的監控能力及人權隱私的弊端。
爭議3:內容及審查機制缺乏透明度,難以信任
國際上的LLM模型通常有嚴格的內容審核與安全機制,確保模型不會生成危害社會或違反倫理的內容。
與OpenAI、Google等公司不同,Deepseek 的訓練數據來源未公開,導致模型的偏見(Bias)、內容自我審查及不受監督的操控,成為操控輿論或資訊戰的工具。
爭議4:OpenAI控訴其透過「模型蒸餾」技術,侵犯知識產權
AI領域存在一種稱為「模型蒸餾(Model Distillation)」技術,這是一種讓較小的模型學習較大模型行為的方式,若不當使用,會成為技術盜竊(Technology Theft)的工具。
OpenAI服務條款規定,用戶不得「複製」任何OpenAI之服務或開發與OpenAI競爭的模型。
Open AI指出,Deepseek利用蒸餾技術抄襲數據,並透過OpenAI模型輸出來開發自家技術,違反使用條款,但目前尚無相關證據。
爭議5:美國Scale AI質疑其盜用禁止向中國出口的NvidiaH100晶片
美國Scale AI執行長Alexandr Wang表示,DeepSeek握有多達5萬顆被禁止向中國出口的Nvidia H100晶片,以開發現有模型,這形同直接挑戰美國出口管制政策。
爭議6:是否誇大訓練的成本效益
據調查,DeepSeek母公司幻方量化(High-Flyer)不僅耗費大量成本購入NVIDIA硬體設備,更投資約1.39億美元打造AI超級電腦,至2023年才成立DeepSeek。
整體而言,包含AI基礎建設與研發成本計算在內,DeepSeek 實際開發成本,遠超其宣稱的560萬美元,存在誇大「低成本」敘述的可能性。
Deepseek現面臨哪些全球禁令?
目前,DeepSeek在全球禁用情況日益嚴重,主要原因是對其數據隱私和安全性問題的擔憂。
義大利
義大利數據保護局(GARANTE)於2025年1月28日發出警告,指出DeepSeek會不當處理用戶的個人資訊,經調查確認數據被存儲在中國伺服器上,隨後從Apple App Store及Google Play下架DeepSeek。
義大利是最早禁止DeepSeek的國家之一。這也導致歐盟各國開始對其進行調查或考慮禁令。
台灣
基於資安風險和資料外洩疑慮,我國數位發展部於2025年1月31日提議,公務機關應限制使用DeepSeek,並於2月3日宣布全面禁用該AI服務,同時要求公立大學及研究機構在經過批准後才可使用。
美國
美國尚未統一發佈全國禁令,但多個政府部門已經採取行動:
美國國會:眾議院首席行政官發出通知,限制所有職員在官方設備上使用DeepSeek。
德州:禁止在政府設備上安裝DeepSeek,州長Greg Abbott強調不會允許中國共產黨滲透該州的基礎設施。
美國國防部及海軍:國防資訊系統署(DISA)發佈禁令,不允許存取 DeepSeek 網站,並禁止海軍人員「以任何形式」使用 DeepSeek 的產品,包括工作相關事務或個人用途。
美國太空總署(NASA):全面禁止員工使用 DeepSeek,包括工作相關事務或個人用途。
Comments