DeepSeek

DeepSeek，一個2023年發佈的中國AI模型，提供經濟高效的數據分析、機器學習和NLP工具，憑藉其具有競爭力的價格和性能顛覆了市場，儘管面臨知識產權侵權的指控。其創新的架構和廣泛的行業應用潛力表明其未來價值巨大。

發展歷程[編輯 | 編輯原始碼]

2023年，幻方量化正式成立 DeepSeek，專注於 AI 大模型研發。DeepSeek 繼承了幻方量化在技術、人才和資源方面的積累，迅速在 AI 領域嶄露頭角。

2024年5月6日，DeepSeek 發佈了 DeepSeek-V2 開源 MoE 模型，通過如 MLA（多頭潛在注意力機制）和 MoE（混合專家模型）等創新架構，實現了性能與成本的雙重突破。

2024年12月26日，DeepSeek 正式發佈了 DeepSeek-V3 大模型。

2025年1月20日，擁有 660B 參數的超大規模模型 DeepSeek R1 正式發佈。

2025年1月28日，DeepSeek發佈了開源多模態人工智能模型Janus-Pro，在基準測試中表現出色。