DeepSeek

出自非小号百科
於 2025年2月5日 (三) 02:08 由 Week留言 | 貢獻 所做的修訂 (创建页面,内容为“DeepSeek,一个2023年发布的中国AI模型,提供经济高效的数据分析、机器学习和NLP工具,凭借其具有竞争力的价格和性能颠覆了市场,尽管面临知识产权侵权的指控。其创新的架构和广泛的行业应用潜力表明其未来价值巨大。 == 发展历程 == 2023年,幻方量化正式成立 DeepSeek,专注于 AI 大模型研发。DeepSeek 继承了幻方量化在技术、人才和资源方面的积累…”)
(差異) ←上個修訂 | 最新修訂 (差異) | 下個修訂→ (差異)

DeepSeek,一個2023年發布的中國AI模型,提供經濟高效的數據分析、機器學習和NLP工具,憑藉其具有競爭力的價格和性能顛覆了市場,儘管面臨智慧財產權侵權的指控。其創新的架構和廣泛的行業應用潛力表明其未來價值巨大。

發展歷程[編輯 | 編輯原始碼]

2023年,幻方量化正式成立 DeepSeek,專注於 AI 大模型研發。DeepSeek 繼承了幻方量化在技術、人才和資源方面的積累,迅速在 AI 領域嶄露頭角。

2024年5月6日,DeepSeek 發布了 DeepSeek-V2 開源 MoE 模型,通過如 MLA(多頭潛在注意力機制)和 MoE(混合專家模型)等創新架構,實現了性能與成本的雙重突破。

2024年12月26日,DeepSeek 正式發布了 DeepSeek-V3 大模型。

2025年1月20日,擁有 660B 參數的超大規模模型 DeepSeek R1 正式發布。

2025年1月28日,DeepSeek發布了開源多模態人工智慧模型Janus-Pro,在基準測試中表現出色。