头条
微软CTO 认为 LLM 缩放定律将保持不变
在最近的一次采访中,微软首席技术官 Kevin Scott 表示有信心大型语言模型“缩放定律”将继续推动人工智能的发展,反驳了对收益递减的怀疑。
OpenAI 定义了人工智能达到人类智能的五个“级别”
https://qz.com/openai-five-level-system-human-intelligence-ai-1851588122
OpenAI 最近分享了一个五级系统来跟踪其通用人工智能的进展。这些级别从目前可用的级别到可以执行与组织相同工作量的人工智能。它们可能会根据员工、投资者和公司董事会的反馈而改变。 OpenAI 高管认为,该公司的 AI 目前处于第一级,但正在接近第二级,即 AI 可以解决一些基本的问题。
a16z 正试图通过 Oxygen 计划让 AI 保持活力
https://www.theverge.com/2024/7/9/24195082/a16z-trying-to-keep-ai-alive-with-oxygen-intiative
风险投资公司 Andreessen Horowitz 已获得数千个 AI 芯片以换取股权。
研究
SpreadsheetLLM
https://arxiv.org/abs/2407.09025
一篇很棒的论文,概述了如何将电子表格转换为对现代 LLM 有用的表示形式。这可用于问答、格式化和其他数据操作。
自动分布外检测
https://arxiv.org/abs/2407.08966v1
标签驱动的自动提示调整 (LAPT) 是一种用于 CLIP 等视觉语言模型中的分布外 (OOD) 检测的新方法。
使用超图学习进行文本到 3D 生成
https://arxiv.org/abs/2403.09236v1
Hyper-3DG 通过关注几何和纹理之间的复杂关系来改进文本到 3D 模型的生成。
工程
增强低光图像
https://github.com/jianghaiscu/lightendiffusion
LightenDiffusion 使用扩散模型和 Retinex 理论改善低光图像。
动态场景中的单目深度估计
https://sungmin-woo.github.io/prodepth/
ProDepth 是一种用于单目深度估计的新框架,可解决动态场景中移动物体引起的问题。它使用概率方法来识别和纠正深度估计中的不一致之处。
森林监测
https://arxiv.org/abs/2407.09392v1
Open-Canopy 是一个高分辨率(1.5 米)开放访问数据集,用于估计法国各地的树冠高度。
杂七杂八
托管服务即软件
https://dannguyenhuu.substack.com/p/introducing-the-managed-service-as
托管服务即软件 (M-SaS) 初创公司正在兴起,其中 AI 驱动的面向服务的初创公司根据新的商业模式蓝图建立公司。这需要初创公司从根本上转变思维方式,使用 AI,而不是销售 AI。这些初创公司最初是劳动密集型的,毛利率较低,逐渐通过自动化和 AI 转向更高的 SaaS 式毛利率。
AI 初创公司 Hebbia 以 7 亿美元估值融资 1.3 亿美元
作为 AI 初创公司获得高估值的一个例子,Hebbia 以 1300 万美元的 ARR 以 7 亿美元的估值融资 1.3 亿美元。Hebbia 的主要产品 Matrix 可以分析大型文档并以电子表格格式响应用户查询。目前,30% 的资产管理者将其用于研究目的。该公司计划利用新资金扩大其团队并向其他行业(例如律师事务所和制药公司)提供服务。
人工智能会变得有意识吗?目前,我们无法判断
https://arstechnica.com/science/2024/07/could-ais-become-conscious-right-now-we-have-no-way-to-tell/
关于人工智能可能实现意识的争论正在加剧,人们对机器学习和神经形态计算的进步是否会导致有感知的机器的看法截然不同。综合信息理论表明,由于当前硬件的限制,人工智能意识不太可能出现,而注意力图式理论和全局神经元工作空间理论等计算功能主义理论则认为这是不可避免的。神经科学寻求一种统一的意识理论,以更好地理解其在人工智能中的潜在出现。
Crawlee 用于数据采集
https://github.com/apify/crawlee-python
一个基于许多抓取软件构建的新工具包,可帮助大规模收集网络数据。
Pixel 9 Pro 或将配备为期一年的 Gemini Advanced
https://9to5google.com/2024/07/15/pixel-9-pro-might-gemini-advanced/
最新的 Google 应用测试版显示,“Pixel Pro”系列(可能包括 Pixel 9 Pro 和 Pixel 9 Pro Fold)的购买者将获得为期一年的 Gemini Advanced 免费订阅,这是 Google 最强大的 AI 模型。
公司放弃赋予 AI 工作者“权利”的计划
https://futurism.com/startup-ai-rights-org-chart
人力资源软件公司 Lattice 宣布将授予 AI 算法“权利”,将其作为“数字工作者”与经理和绩效评估整合在其产品中,此举遭到强烈反对。