Hot AI Informations

DeepSeek-V3 Technical Report

eepSeek-V3，一个强大的混合专家 (MoE) 大语言模型，总参数量为 670 亿，每个 Token 激活 370 亿参数。为了实现高效的推理和具有成本效益的训练，DeepSeek-V3 采用了多头潜在注意力 (MLA) 和 DeepSeekMoE 架构，这些架构在 DeepSeek-V2 中得到了充分验证。此外，DeepSeek-V3 首创了一种无辅助损失的负载均衡策略，并为获得更强的性能设定了多 Token 预测训练目标。我们在 14.8 万亿个多样化且高质量的 Token 上预训练 DeepSeek-V3，然后进行监督微调和强化学习阶段，以充分发挥其能力。全面的评估表明，DeepSeek-V3 的性能优于其他开源模型，并达到了与领先的闭源模型相当的性能。尽管 DeepSeek-V3 性能卓越，但其完整训练仅需 278.8 万 H800 GPU 小时。此外，其训练过程非常稳定。在整个训练过程中，我们没有遇到任何不可恢复的损失峰值或执行任何回滚。

AI Papers List

Get More AI Papers

The Stochastic Parrot on LLM's Shoulder: A Summative Assessment of Physical Concept Understanding

: 177

LLMs; Physical Concept Understanding; Stochastic Parrot Phenomenon

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

: 153

LLM Agents; AI Research Tasks; MLGym-Bench

Qwen2.5-VL Technical Report

: 137

Qwen2.5-VL; Vision-Language Model; Dynamic Resolution; Impressive

Expect the Unexpected: FailSafe Long Context QA for Finance

: 117

FailSafeQA; LLM Robustness; Financial Applications

Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling

: 114

Test-Time Scaling (TTS); Large Language Models (LLMs); Compute-Optimal Strategy

SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

: 107

SigLIP 2; Multilingual Vision-Language Encoders; Improved Fairness

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

: 99

Sparse Attention; Long-Context Modeling; Hardware-Aligned Optimizations

SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines

: 89

Large Language Models (LLMs); SuperGPQA; Knowledge Domain Gap

Scaling up Test-Time Compute with Latent Reasoning: A Recurrent Depth Approach

: 82

Latent Space Reasoning; Scalable Language Model; Implicit Reasoning

SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators

: 81

Multilingual Text Detoxification; SynthDetoxM; Superior Performance

Goku: Flow Based Video Generative Foundation Models

: 71

Goku; joint image-and-video generation; rectified flow Transformers

How Much Knowledge Can You Pack into a LoRA Adapter without Harming LLM?

: 67

LoRA; Large Language Models (LLMs); Knowledge retention

AI Tools List

Get More AI Tools

EngagexAI

Automates video and podcast creation with AI technology.

Indigo

AI tool for managing prompts and enhancing team productivity.

KeyMentions

Tracks brand mentions and keywords on Reddit for marketing.

WorkFindMe

AI platform for job matching and recruitment automation.

Pump Fun Coin

Simplified guide for creating Solana MEME Coins easily.

Songifier Song Identifier

AI tool to identify songs from a few lyric words.

Sibasi eBoard

AI solution for efficient board and committee management.

AdGPT

AI platform for creating high-converting ads in seconds.

AI News List

Get More AI News

用于临床工作流程的新AI助手，微软推出Microsoft Dragon Copilot

微软在HIMSS 2025上发布了Microsoft Dragon Copilot，这是一款基于AI的语音解决方案，旨在简化临床医生的工作流程。Dragon Copilot集成了Dragon Medical One和DAX Copilot的功能，并利用生成式AI技术，将多种特定任务应用程序统一到一个平台，方便医生进行口述笔记和自动执行任务。该产品还具备查询外部医疗信息来源的能力，例如疾病控制中心和FDA，为医生提供更全面的决策支持。微软表示，Dragon Copilot旨在提高临床医生的生产力、效率和改善患者体验。

生物版DeepSeek的隐秘竞争，中国模型被视为更强对手，赛诺菲10亿美金押宝！

美国斯坦福大学和英伟达等机构发布的生物学AI模型Evo2引发关注，但其研究人员指出，中国百图生科的xTrimo系列大模型是参数规模更大但尚未开源的竞争对手，显示了中国在生物大模型领域的实力。百图生科已推出全模态生物大模型xTrimo V3，拥有2100亿参数，是目前全球最大规模的生命科学AI基础模型，能够对DNA、RNA、蛋白质等多种生物数据进行建模。百图生科即将开源1000亿参数版本，旨在通过生态协作推动全球生命科学研究，并且已经与赛诺菲达成大型战略协议，共同开发生物治疗药物，其技术已应用于药物研发、精准医疗等领域，并服务了全球数百家用户。

小红书AI搜索神器「点点」接入DeepSeek，我们拿它单挑百度

小红书旗下的AI搜索App“点点”上线了“深度思考”功能，并接入了DeepSeek R1大模型，旨在提供更优质的生活场景搜索体验。点点通过啃食10亿+小红书帖子，能够整合碎片化的经验，生成结构化的攻略内容，并提供本地化的搜索体验，其搜索结果不仅限于小红书，还有大众点评、B站等来源。与传统搜索相比，点点能提供更精准、更便捷的搜索体验，但有时也会出现信息错误。小红书在AI领域动作频频，不断推出AI产品，而百度等传统搜索巨头也在积极拥抱AI技术。

DeepSeek R1与OpenAI模型文风相似度高达74.2%？新研究质疑DeepSeek训练数据

Copyleaks 的一项新研究表明，DeepSeek 生成的文本有 74.2% 的内容在风格上与 OpenAI 模型惊人地相似。Copyleaks 开发了一种由三个分类器组成的集成系统，该系统经过训练，可以识别 Claude、Gemini、Llama 和 OpenAI 等语言模型生成的文本。研究发现，DeepSeek 的文本最容易被分类为 OpenAI 生成，引发了对其训练过程的质疑。Copyleaks 的数据科学主管 Shai Nisan 认为，这种相似性可能表明 DeepSeek 使用了 OpenAI 的输出作为训练数据，但同时也承认数据重叠也可能导致风格趋同。该研究的检测方法使用了多数投票制和一致同意制，最终选择一致同意制以降低误判概率。

半个世纪后，著名的麦凯猜想终获证明！数学家夫妇终结了一个未解群论难题

数学家Britta Späth和Marc Cabanes经过20年的努力，成功证明了困扰数学界几十年的麦凯猜想。该猜想指出，描述一个群的关键在于研究其一小部分，即Sylow正规化子，它们可以揭示整个群的性质。Späth最初独自研究该猜想，后来与Cabanes合作并最终完成证明，他们的成果发表在2024年7月的论文中。麦凯猜想的证明简化了对群的研究，只需要分析Sylow正规化子即可了解群的关键性质。

北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

北京大学彭宇新教授团队发布了其在多轮交互式商品检索方面的最新研究成果，该成果已被 ICLR 2025 接收并开源。该研究针对现有方法在多轮组合图像检索（MTCIR）中历史上下文缺失和数据规模受限的问题，构建了新的多轮组合图像检索数据集FashionMT，并提出了多轮聚合-迭代模型MAI。MAI模型通过引入两阶段语义聚合（TSA）和循环组合损失（CCL）来应对多模态语义聚合的挑战，同时设计了一种无参数的多轮迭代优化（MIO）机制来优化多轮信息。实验结果表明，MAI方法在FashionMT数据集上的召回指标上平均提升了8%，优于现有方法，能够有效处理细粒度需求和满足回溯性需求。

上海交通大学医学院人工智能蛋白质设计课题组诚聘助理研究员、博士后、客座学生

上海交通大学医学院人工智能蛋白质设计课题组正在招聘助理研究员、博士后和客座学生。课题组PI张海仓在人工智能算法及“AI + 生命科学”交叉领域有长期积累，尤其擅长AI蛋白质设计与AI药物设计。课题组研究方向包括人工智能算法研究、人工智能驱动的蛋白质设计和结构预测。招聘岗位对人工智能、数学、生物信息学等背景有要求，并要求具备相关领域的科研经验和论文发表能力，薪资待遇将按照上海交通大学医学院的有关规定执行，具体情况面议。

耶鲁、剑桥等开发MindLLM，将脑成像直接转换为文本

耶鲁大学、剑桥大学等机构的研究人员开发了一种名为MindLLM的模型，旨在将功能性磁共振成像 (fMRI) 信号直接解码为文本。MindLLM模型通过神经科学信息注意层和可学习查询，并结合大脑指令调整(BIT)方法，能够更好地从fMRI信号中捕获语义信息，实现更通用的解码。实验结果表明，MindLLM在下游任务、未知主题泛化和新任务适应方面均优于现有模型，并为脑机接口和理解大脑机制提供了新的可能性。这项技术有望帮助语言障碍者恢复沟通能力，并实现健康人群对数字设备的神经控制。

AI Model Comparison

Get More Model Details