陳鳳珠:開源語言模型有助推動人工智能發展 陳鳳珠
DeepSeek的出現再次掀起人工智能熱潮,並挑戰美國的大型語言模型的地位,同時因DeepSeek的低成本引發高端晶片未來發展的憂慮。據CB Insights的資料,2024年全球創投資金規模達到2,746億美元,其中投資人工智能領域
的金額達到1,004億美元,佔比超過三分一,反映市場對於人工智能發展前景的信心。
OpenAI的ChatGPT、Meta的LLaMA、阿里巴巴的通義千問、深度求索的DeepSeek均為大型語言模型範例,大型語言模型(LLM)為人工智能程式,主要讓機械通過海量資料訓練的深度學習演算建立知識,繼而分析數據、創建內容、解碼圖像、搜索資訊或作為客戶服務回答問題等。而部份大型語言模型定位為開源模型,允許公眾自由訪問、使用、修改,由於模型的內部結構和訓練過程是公開的,因此開發人員可根據自身需求進行修改和改進模型,並可作定制化應用,透過持續的微調來提高模型的可信度和可靠性。開源模型有助降低人工智能的使用門檻,推動人工智能的廣泛應用,促進技術的普及,其中DeepSeek-R1及V3為開源模式,但成本相對較低,且效能高,因此其他開發商採用DeepSeek模型可有效降低開發成本,推動人工智能發展更迅速。
DeepSeek模型使用英偉達H800晶片,為當初英偉達為內地特製的晶片,以規避美國禁止向內地出售H100晶片的限制,H800晶片的計算速度只有H100的一半,而H800晶片的價格約較H100低一至三成。由此可見,即使美國持續打壓內地的高科技發展,內地科企仍能通過研發及可用晶片創造高性能的產品。據了解,DeepSeek使用了約2000至3000塊H800晶片,以開發DeepSeek-V3模型,單計圖形處理器(GPU)的成本約為3.85億至7.21億元人民幣。另外,DeepSeek-V3的開發費用為557.6萬美元,遠低於美國企業開發的人工智能模型。
京東雲、華為、阿里雲、騰訊(00700)、金山雲(03896)、美圖(01357)以及內地三大電訊營運商等企業均已表示接入DeepSeek開源大模型,反映不同行業的企業將通過人工智能加快發展,預期DeepSeek的出現有助企業長線提升效益。
獨立股評人陳鳳珠
(筆者本人並沒有持有上述股票)
專家點評 - 陳鳳珠 舊文
本文作轉載及備份之用 來源 source: http://hk.on.cc