播播机 Logo

播播机

Powered by

特工宇宙Coze 扣子
学术论文

Agent AI: Surveying the Horizons of Multimodal Interaction

Zane Durante, Qiuyuan Huang, Naoki Wake, Ran Gong, Jae Sung Park, Bidipta Sarkar, Rohan Taori, Yusuke Noda, Demetri Terzopoulos, Yejin Choi, Katsushi Ikeuchi, Hoi Vo, Li Fei-Fei, Jianfeng Gao
2024-01-25
arXiv
LLMAI综述

摘要

本研究探讨了大型语言模型在常识知识方面的应用,特别是在大规模任务规划中的作用。我们提出了一种新的框架,利用LLM的常识推理能力来增强自主代理的任务规划能力。实验表明,与传统方法相比,我们的方法在复杂任务规划中表现出显著优势。

播客

0:00
加载中...

播放速度:

全文

Agent AI: Surveying the Horizons of Multimodal Interaction - 学术论文

相关内容

学术论文

Synergizing RAG and Reasoning: A Systematic Review

近期大语言模型(LLM)在推理能力上的突破,使得检索增强生成(RAG)达到了前所未有的高度。通过将检索机制与高级推理相结合,LLM 现在能够应对日益复杂的问题。本文系统性地回顾了 RAG 与推理之间的协同作用,明确界定了 RAG 语境下的"推理"概念。我们构建了一个涵盖多维协作目标、代表性范式和技术实现的全面分类体系,并分析了双向协同的方法。此外,本文还批判性地评估了当前 RAG 评测中的局限性,包括多步推理缺乏中间监督,以及与成本-风险权衡相关的实际挑战。为弥合理论与实践的鸿沟,我们还针对多样化的真实应用场景,提供了实用指南。最后,本文指出了有前景的研究方向,如基于图的知识整合、混合模型协作和强化学习驱动的优化。总体而言,本研究为学术界和工业界推进 RAG 系统提供了理论框架和实践基础,助力下一代 RAG 解决方案的发展。。

2025-04-22
学术论文

Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systems

大型语言模型(LLMs)的出现,推动了人工智能领域的变革性进步,为能够进行复杂推理、强大感知和多领域灵活行动的高级智能体铺平了道路。随着这些智能体在AI研究和实际应用中扮演越来越重要的角色,其设计、评估和持续改进也带来了复杂且多层面的挑战。本综述全面梳理了相关进展,将智能体置于一种模块化、类脑架构之中,融合了认知科学、神经科学和计算研究的原理。我们将探讨分为四个相互关联的部分。首先,深入分析智能体的模块化基础,系统地将其认知、感知和操作模块映射到人脑的类似功能,并阐释记忆、世界建模、奖励处理和类情感系统等核心组成部分。其次,讨论自我增强与适应性进化机制,探索智能体如何自主提升能力、适应动态环境,并通过自动化优化范式(包括新兴的AutoML和LLM驱动的优化策略)实现持续学习。第三,考察协作与进化的多智能体系统,研究智能体间互动、协作和社会结构中涌现的集体智能,突出其与人类社会动态的相似之处。最后,聚焦于构建安全、可靠且有益的AI系统,强调内在与外在的安全威胁、伦理对齐、鲁棒性以及实现可信实际部署所需的实际缓解策略。

2025-03-31