【2023年12月13日 - AI世界发生了什么】 AI+robotics 1、首个GPT-4驱动的
【2023年12月13日 - AI世界发生了什么】AI+robotics1、首个GPT-4驱动的人形机器人!无需编程+零样本学习,还可根据口头反馈调整行为%E9%A6%96%E4%B8%AAGPT-4%E9%A9%B1%E5%8A%A8%E7%9A%84%E4%BA%BA%E5%BD%A2%E6%9C%BA%E5%99%A8%E4%BA%BA%EF%BC%81%E6%97%A0%E9%9C%80%E7%BC%96%E7%A8%8B%2B%E9%9B%B6%E6%A0%B7%E6%9C%AC%E5%AD%A6%E4%B9%A0%EF%BC%8C%E8%BF%98%E5%8F%AF%E6%A0%B9%E6%8D%AE%E5%8F%A3%E5%A4%B4%E5%8F%8D%E9%A6%88%E8%B0%83%E6%95%B4%E8%A1%8C%E4%B8%BA让GPT-4操纵人形机器人,事先不做任何编程or训练,会是什么样?来自东京大学和日本Alternative Machine公司。探索了首个由GPT-4驱动人形机器人的研究。依靠这项研究,用户无需事先给机器人编程,只需语言输入、也就是动动嘴皮和GPT-4聊上一会儿,就能让机器人根据指令完成行动。上面的比较偏媒体向,想更深入了解的看这个:Research%20Paper%20Results2、练习时长两年半,特斯拉人形机器人Optimus二代上线%E7%BB%83%E4%B9%A0%E6%97%B6%E9%95%BF%E4%B8%A4%E5%B9%B4%E5%8D%8A%EF%BC%8C%E7%89%B9%E6%96%AF%E6%8B%89%E4%BA%BA%E5%BD%A2%E6%9C%BA%E5%99%A8%E4%BA%BAOptimus%E4%BA%8C%E4%BB%A3%E4%B8%8A%E7%BA%BF没有经过任何预告,特斯拉人形机器人「Optimus」第二代来了。12 月 13 日上午,马斯克突然在 X 上放出了一段视频:马斯克不多解释,直接用视频内容展示了 Optimus 的诸多新能力。从设想到蹒跚学步,再到引发恐怖谷效应,练习时长两年半,Optimus 这回的亮相惊艳了世人。3、LMDrive: 利用大语言模型进行闭环端到端驾驶%5B2312.07488v1%5D%20LMDrive%3A%20Closed-Loop%20End-to-End%20Dri...尽管在自动驾驶领域取得了显著的进展,但现代方法在面对长尾未预见事件和具有挑战性的城市场景时仍然存在严重事故的风险。大语言模型(LLM)展现出令人印象深刻的推理能力,接近于“人工智能通用智能”。然而,传统的自动驾驶方法通常依赖于有限格式的输入,如传感器数据和导航路点,这限制了车辆理解语言信息和与人类交互的能力。因此,本文介绍了一种创新的基于语言引导的闭环自动驾驶框架——LMDrive。LMDrive能够同时处理和整合多模态传感器数据和自然语言指令,实现了与人类和导航软件在实际教学环境中的交互。为促进基于语言的闭环自动驾驶的深入研究,我们还公开发布了相应的数据集,其中包括约64K条遵循指令的数据片段,并进行了LangAuto基准测试,以评估系统处理复杂指令和具有挑战性驾驶场景的能力。通过广泛的闭环实验验证了LMDrive的有效性。据我们所知,这是首个利用LLMs进行闭环端到端自动驾驶的工作。AI Agents/AGI1、服务长上下文语言智能体的 diff历史%5B2312.07540v1%5D%20diff%20History%20for%20Long-Context%20Langu...语言模型(LMs)为通用体验控制提供了一个引人入胜的解决方案。然而,在使用基于LM的控制器时,出现了一个关键的技术问题:必须将环境观测转换为文本,而将其与历史记录结合可能导致文本提示变得非常庞大。结果是,先前关于LM智能体的研究局限于具有小观测大小或最小交互历史需求的受限领域。在本文中,我们提出了一个简单而高效的解决方案来解决这些问题。我们利用连续文本观测中具有高相似性的事实,并提出通过Unix diff命令对它们进行压缩。我们在NetHack中展示了我们的方法,这是一个需要长期推理做出决策的复杂地下城游戏,对于神经智能体来说仍然是一个挑战。Diff历史记录提供了平均4倍的增加,使LM能够利用更长的基于文本的交互历史。这种观测压缩以及抽象的好处使得在保留的环境实例上,游戏得分相比最先进的基准模型提高了7倍。它还比使用视觉观测的先前智能体性能提高了40%以上。2、使用SGLang对大语言模型进行高效编程%5B2312.07104v1%5D%20Efficiently%20Programming%20Large%20Langu...越来越多的大型语言模型(LLMs)被应用于复杂任务,这些任务需要多个链结生成调用、高级提示技术、控制流以及与外部环境的交互。然而,目前非会员试读20%,加入社区后可阅读全文
页:
[1]