DeepSeek

DeepSeek，一个2023年发布的中国AI模型，提供经济高效的数据分析、机器学习和NLP工具，凭借其具有竞争力的价格和性能颠覆了市场，尽管面临知识产权侵权的指控。其创新的架构和广泛的行业应用潜力表明其未来价值巨大。

发展历程编辑

2023年，幻方量化正式成立 DeepSeek，专注于 AI 大模型研发。DeepSeek 继承了幻方量化在技术、人才和资源方面的积累，迅速在 AI 领域崭露头角。

2024年5月6日，DeepSeek 发布了 DeepSeek-V2 开源 MoE 模型，通过如 MLA（多头潜在注意力机制）和 MoE（混合专家模型）等创新架构，实现了性能与成本的双重突破。

2024年12月26日，DeepSeek 正式发布了 DeepSeek-V3 大模型。

2025年1月20日，拥有 660B 参数的超大规模模型 DeepSeek R1 正式发布。

2025年1月28日，DeepSeek发布了开源多模态人工智能模型Janus-Pro，在基准测试中表现出色。