Capital 資本平臺

中國人工智慧初創公司 DeepSeek 近年來在全球 AI 產業中嶄露頭角，其憑藉極低的研發成本和高效率的運算策略，接連推出 DeepSeek V3、專注推理能力的 DeepSeek R1 以及面向多模態應用的 Janus Pro 模型，均引起業界廣泛關注。許多人熱議 DeepSeek，筆者在此提供一個簡要綜述，讓讀者了解這股新力量的崛起背景與優勢。這三款模型不僅在表現上能與美國對手媲美，甚至在部分測試中超越對方；同時，DeepSeek 採取開源方式，促進技術共享，挑戰了傳統需要巨額投資和大量算力的研發模式。

DeepSeek V3：以低成本實現語言理解與生成

DeepSeek V3 是 DeepSeek 推出的大型語言模型，主要用來理解和生成文字，比如回答問題、撰寫文章或幫助程式設計。這款模型的特點在於：

低成本高效率 DeepSeek V3 使用較少的硬體資源就完成了訓練，所需成本僅為OpenAI GPT-4o 的十分之一。這意味著它能以更低的投入達到與 GPT-4o 類似的效果。與 Meta 的 Llama 系列相比，V3 也展現了更出色的語言理解能力，且運用成本更低，讓更多公司有機會使用尖端技術。
與GPT-4o 及 Llama 的對比雖然GPT-4o 由於資源充足在語言生成上非常強大，但其背後需要龐大投資；而 DeepSeek V3 則以更經濟的方式達到相似表現。Llama 系列同樣屬於開源模型，但 DeepSeek V3 更佳的能力使其更具吸引力。

DeepSeek R1：開放且具推理能力的模型

在 V3 的基礎上，DeepSeek 推出了 R1 模型，專注於處理複雜問題和邏輯推理，讓模型能夠「思考」如何解決問題，並自動檢查與修正答案。

強調自我檢查 R1 模型不需要大量人工干預，而是通過自己的「思考」過程來提高回答準確度。這使得它在解決數學題目或編程問題時，表現與 OpenAI 的 o1 模型十分接近。
開源優勢與o1 模型不同，R1 模型採用完全開源的方式，讓所有人都可以下載、使用和改進，這對推動技術普及非常重要。

Janus Pro：多模態應用的新突破

Janus Pro 模型主要用於處理文字與圖像之間的轉換，也就是我們常說的「文生圖」應用。它能夠根據文字描述生成圖像，並且在這一功能上與西方對手形成了鮮明對比。

單一模型實現雙重功能與 OpenAI 的 GPT 4v 和 DALL E 3 相比，後者通常需要兩個不同的模型分別處理圖像理解和生成，Janus Pro 則能用一個較小的模型同時完成這兩項任務，既簡化了運作流程，又降低了部署難度與成本。
與 GPT 4v 和 DALL E 3 的對比 GPT 4v 和 DALL E 3 雖然在圖像生成上效果出眾，但其運作通常依賴較大模型和更多計算資源；而 Janus Pro 在保持高效表現的同時，運用更少的資源，這使得它更適合在多種環境中快速部署和應用。

技術創新與全球影響以下為筆者整理部份DeepSeek的關鍵創新：

低成本與資源優化訓練： 以不到600 萬美元的成本訓練出模型，相較於西方競爭對手大幅降低訓練費用與硬體需求

強化學習驅動推理能力： 利用大規模強化學習及基於規則的獎勵機制，使模型具備自我修正及逐步推理能力，能有效解決複雜數學和程式設計問題

創新的模型蒸餾技術： 將大型模型的推理能力轉移至較小、高效的蒸餾模型，在大幅降低推論成本的同時保留優異性能

高效架構與低階優化： 採用混合專家（MoE）、多頭潛在注意力（MLA）等技術，加上低精度運算與優化的 GPU 通訊，顯著減少計算資源與記憶體使用

從 DeepSeek V3 的低成本大模型，到強調推理能力的 R1，再到能夠同時處理文字與圖像的 Janus Pro，DeepSeek 正以其獨特的創新方式改變全球 AI 產業的競爭格局。與 OpenAI 和Meta 的模型相比，DeepSeek 在保持高性能的同時，極大降低了成本；而在多模態應用方面。隨著越來越多的開發者和企業開始關注並借鑒這種新模式，未來的 AI 技術將變得更加高效、普及和民主化。

撰文：陳迪源

香港創科發展協會創會主席、自由黨中央委員

深入閱讀政經生活文化，更多內容盡在：

Website：www.capital-hk.com

Facebook：www.facebook.com/CapitalPlatformHK

Instagram：www.instagram.com/capital.ceo.entrepreneur/

LinkedIn：www.linkedin.com/company/capitalhk/