加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

是我没有定义清楚问题还是这两个大模型的理解水平有问题?

(2025-03-22 12:08:34)

是我没有定义清楚问题还是这两个大模型的理解水平有问题?

程晓华

2025-3-21

同一个问题,我分别问了deepseekkimi这两个大模型,结果它们两个给出的答案是不一样的,但deepseek给出的结果与我用R语言计算的结果是一致的。

以下是我问的问题的描述:

现有10个人的考试成绩,分别为91100,每个人成绩都是正整数,且每个人成绩都不一样。要求严格按成绩高低排序分成ABC三组,每组人数都大于1,每组人的成绩都是由高到低排列,且每组内成绩不能有间断,其中A组成绩最好,B组次之,C组最差,请问:这样总共有多少种分组方法?

事情的起因是,我正在把我的一篇文章《绩效考核中强制分组的合理性问题研究》(2023-7-8发布于我的订阅号ITOOTD)做简单化处理,准备重新发布,以便于更多的人理解我的文章中的观点。

我现在面临的问题是:

1.    我感觉kimi的解析过程有着明显的错误;

2.    Deepseek对这个问题的解析过程非常复杂,我看不懂,所以我无法说服自己承认这个结果;

3.    我用R语言做的计算过程无法保证其严谨性;

4.    Deepseek的输出与我用R语言计算的结果一致有可能只是一种巧合;

5.    我不知道怎么用排列组合或其他的数学方法来证明以上两种结论的真假。

那现在的问题就是:

1.    都是大模型,为什么deepseekkimi给出的答案不一致呢?是我定义的问题不够清晰还是不同的大模型理解问题的能力不一样?

2.    这个问题的答案到底是什么?

【备注】我还是计划用R语言输出的结果来继续写我的文章,将在近两天发布于我的订阅号。

作者程晓华(John Cheng),全面库存管理(TIM)咨询独立顾问、制造业库存控制技术与策略课程创始人、讲师,《制造业库存控制技巧》《首席物料官》《决战库存》《制造业全面库存管理》《全面库存管理数学分析》著作者;1995年开始接触MRP,深耕制造业供应链管理近30年,一直聚焦于库存与交付问题的实践和咨询。


0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有