- 大模型在装傻!谷歌苹果最新发现:LLM知道但不告诉你,掌握知识比表现出来的多 (0篇回复)
- 谷歌&MIT何恺明团队:视觉大模型像LLM一样高效Scaling,指路连续token+随机生成顺序 (0篇回复)
- 英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快 (0篇回复)
- 推理性能飙升1.5倍!微软疯狂下单GB200芯片提升其AI算力 (0篇回复)
- AI「电子舌头」精准检测食品新鲜度与安全 (0篇回复)
- AI服务器需求激增,推动全球市场增长 (0篇回复)
- 字节跳动澄清“实习生破坏大模型训练”:公司大模型不受影响 (0篇回复)
- 成都女生如何改写了AI进程 (0篇回复)
- Mistral AI因盈利难题和高性能模型成收购焦点 (0篇回复)
- Bengio团队新论文!KL正则化有漏洞,强化学习新策略:不要做我可能不会做的事情 (0篇回复)
- LLM数学推理能力遭质疑,苹果研究揭示大语言模型缺乏真正推理能力 (0篇回复)
- Anthropic研究揭示AI模型潜在破坏力 (0篇回复)
- 微软AI CEO苏莱曼:当前 AI 的最大挑战在于如何打造一种值得信任的技术 (0篇回复)
- 科大讯飞三季度营收55.25亿元,下周将升级讯飞星火大模型底座能力 (0篇回复)
- “胃之书”开发者的AI新产品来了!陌生人闹钟,让随机的陌生人叫你起床 (0篇回复)
- 直击a16z路演!32家AI创企,看 AI+游戏的未来可能性在哪里 (0篇回复)
- LangChain 创始人万字科普:手把手教你设计 Agent 用户交互 (0篇回复)
- Jurgen、曼宁等大佬新作:MoE重塑6年前的Universal Transformer,高效升级 (0篇回复)
- 清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点! (0篇回复)
- Meta 发布多项 AI 研究成果,加速高级机器智能发展 (0篇回复)