ChatGPT打败了ChatGPT。
GPT-4在常识和创作类问题上的表现与GPT-3.5和百度的“文心一言”相近,但在演绎推理、逻辑推理等领域表现略好于“文心一言”。
GPT-4尚未开放图像生成外部测试,而“文心一言”的图像生成能力较为出色。
在数学和代码类问题上,GPT-3.5的数学能力表现更好,GPT-3.5和GPT-4在代码生成问题上的表现均不是最优解,而“文心一言”的代码问题识别能力有待加强。
在应用场景测试中,GPT-4、GPT-3.5和“文心一言”在AI生活助手、售后客服、产品推荐、办公场景文本生成等任务上的表现相近,但均在文言文和古诗词理解运用方面表现不佳。
随着训练数据量和模型训练能力的持续提升,各模型性能都有望实现进一步优化完善。此外,值得关注的是微软发布的Copilot,这是一款通过自然语言描述来创建应用、流程或机器人的工具,将提高生产力、让人们更聚焦于创造,并打破业务与技术之间的鸿沟,实现业务与技术的融合,助力各行各业的数字化转型。
对于AI应用的变化,AI将逐步替代收集和部分分析任务,提升工作效率。但在复杂的分析任务上,AI的替代难度较大。百度文心的开放应用将加速国内生成式AI模型的落地应用,帮助生态伙伴实现用户体验提升和生产降本增效。投资方面,可以关注在AI领域进行持续布局且拥有成熟应用场景的公司,如万兴科技、汉得信息、凌志软件、同花顺、金山办公等。