是LLM的老毛病了2025年10月18日此次更新正在保留模子原有本事的根本上,针对用户反应的题目实行了纠正,包含:
DeepSeek前次更新为8月21日,短短一个月,博得这一效果来之不易,可喜可贺。
值得一提的是,新模子正在Humanitys Last Exam(人类结尾的考核)中,效果晋升幅度高达36.48%!
之前,有网友发掘:DeepSeek V3.1输出中随机带有「极」字。网友称:
这一Bug一经导致DeepSeek V3.1无法从事编程或对输出机闭敏锐的闭连职责。盼望官方早日修复。
此次更新鲜明已处理「偶发格外字符等环境」,维系「Code Agent优化」,盼望此次更新能圆满处理DeepSeek无法从事编程或对输出机闭敏锐的闭连职责的Bug。
至于中英文混同,是LLM的老缺欠了,好比OpenAI o3-mini等模子被曝运用中文推理。
咱们也对之前正在网崇高传最广的会触发「极你太美」Bug的Prompt实行了测试:
现正在,新模子给出了5种依时器完毕方式,众处都运用了time.Second。
咱们始末众次考试,均未能复现出该Bug,阐述Bug确实或者一经被修复了。
与DeepSeek-V3.1比拟,新模子正在用具运用与Agent职司中的浮现有较大晋升:
正在计划机术语中,终端(Terminal)也称终端修立,是计划机汇集中处于汇集最外围的修立,首要用于用户消息的输入以及处置结果的输出等。