甚麼是 DeepSeek?
DeepSeek 是一個新興的 AI 語言模型,以卓越的性能和成本效益,成功吸引到全球關注。它是由一間中國杭州的初創公司於 2023 年推出的語言模型 (LLM),能夠進行各種任務,包括回答問題、生成代碼等等。與很多西方 AI 模型不同,西方的 AI 模型需要大量資源,然而 DeepSeek 卻不單止開發成本低,而且具有高效的運行性能,能在最小的硬件配置上運行之餘,更能發揮出跟 OpenAI、Meta 等 AI 相當的性能,因此它的出現,令美國 AI 巨頭公司感受到威脅。DeepSeek 有甚麼優勢?
(1) 成本效益高:DeepSeek 開發成本僅為 600 萬美元,遠低於 OpenAI 和 Meta 投資的數十億美元,這使 DeepSeek 能以更低價格提供強大 AI 服務,對學生、開發者和小型企業特別有吸引力。(2) 開源可及性:DeepSeek 採用了開源的模式,根據 MIT 協議授權其模型,意味着全球開發者都可以自由調整和商業化這項技術,進一步促進創新和技術普及。
(3) 出眾的能力:DeepSeek 在數學推理、代碼生成和一般知識回答等方面表現優異。其最新版本 DeepSeek-R1 利用增強學習技術提升推理和問題解決的能力,並且能在解決複雜方程和生成 Python、Java 代碼方面超越競爭對手。
(4) 免費使用:與需要訂閱的 ChatGPT 不同,DeepSeek 的高級功能對用戶免費開放,進一步提高受歡迎程度。
(5) 能夠進行聯網搜尋。
DeepSeek 與 ChatGPT 的比較
特徵 | DeepSeek | ChatGPT |
---|---|---|
開發成本 | 600 萬美元 | 超過 1 億美元 |
開源 | 是 | 否 |
優勢 | 編程、推理、數學任務 | 創意寫作、對話能力 |
訂閱費用 | 用戶免費;開發者 $0.14/百萬 tokens | 從 $20/月 起 |
硬件需求 | 最小(舊款 Nvidia GPU) | 高端 GPU |
DeepSeek 的背後技術
DeepSeek 採用了多種尖端技術來實現其卓越的性能,例如增強學習(RL)提高推理能力,並且不依賴大量的監督微調。此外,其多階段訓練和專家混合架構(MoE)能在降低記憶體使用的同時,保持高效能。這些創新使 DeepSeek 能在保持高準確度的同時,降低成本。DeepSeek 對全球帶來甚麼影響?
DeepSeek 的出現不僅在 AI 市場引發了價格戰,也挑戰了美國在這一領域的主導地位。其成功促使中國科技巨頭如阿里巴巴和百度降低自己的 AI 服務價格,顯示出其對全球市場的沖擊力。此外,DeepSeek 的開源性質也在努力實現人工智能的普及,挑戰了大公司對先進 AI 的壟斷。============================================
大家都知 ePrice HK Facebook 暫時未能重啟,不過我們最近重新啟動 @eprice_hk Instagram 以及 Threads 帳號!有帳號的,希望大家都可以支持一下啦!
Instagram:@eprice_hk
Threads:@eprice_hk
YouTube:@ePriceHK-mobile