DeepSeek,一个2023年发布的中国AI模型,提供经济高效的数据分析、机器学习和NLP工具,凭借其具有竞争力的价格和性能颠覆了市场,尽管面临知识产权侵权的指控。其创新的架构和广泛的行业应用潜力表明其未来价值巨大。

发展历程 编辑

2023年,幻方量化正式成立 DeepSeek,专注于 AI 大模型研发。DeepSeek 继承了幻方量化在技术、人才和资源方面的积累,迅速在 AI 领域崭露头角。

2024年5月6日,DeepSeek 发布了 DeepSeek-V2 开源 MoE 模型,通过如 MLA(多头潜在注意力机制)和 MoE(混合专家模型)等创新架构,实现了性能与成本的双重突破。

2024年12月26日,DeepSeek 正式发布了 DeepSeek-V3 大模型。

2025年1月20日,拥有 660B 参数的超大规模模型 DeepSeek R1 正式发布。

2025年1月28日,DeepSeek发布了开源多模态人工智能模型Janus-Pro,在基准测试中表现出色。