DeepSeek

出自非小号百科

DeepSeek,一個2023年發佈的中國AI模型,提供經濟高效的數據分析、機器學習和NLP工具,憑藉其具有競爭力的價格和性能顛覆了市場,儘管面臨知識產權侵權的指控。其創新的架構和廣泛的行業應用潛力表明其未來價值巨大。

發展歷程[編輯 | 編輯原始碼]

2023年,幻方量化正式成立 DeepSeek,專注於 AI 大模型研發。DeepSeek 繼承了幻方量化在技術、人才和資源方面的積累,迅速在 AI 領域嶄露頭角。

2024年5月6日,DeepSeek 發佈了 DeepSeek-V2 開源 MoE 模型,通過如 MLA(多頭潛在注意力機制)和 MoE(混合專家模型)等創新架構,實現了性能與成本的雙重突破。

2024年12月26日,DeepSeek 正式發佈了 DeepSeek-V3 大模型。

2025年1月20日,擁有 660B 參數的超大規模模型 DeepSeek R1 正式發佈。

2025年1月28日,DeepSeek發佈了開源多模態人工智能模型Janus-Pro,在基準測試中表現出色。