█脑科学动态
49岁后大脑主动"劝退"运动
5岁儿童已具备"地图导航"能力
左撇子更易患孤独症?惯用手与神经疾病的深层关联
全器官免疫细胞基因表达图谱问世
你的身体信号在帮你做道德选择
抑郁青少年更易陷入社交媒体比较陷阱
帕金森病治疗新希望:破解靶向USP30蛋白的抑制剂机制
你的大脑真实年龄是多少?最新脑功能连接图谱告诉你
█AI行业动态
OpenAI转型公共利益公司
OpenAI 洽谈30亿美元收购AI编程助手Windsurf
英伟达开源Llama-Nemotron模型家族
谷歌更新了其旗舰大型语言模型Gemini 2.5 Pro Preview(I/O版)
█AI驱动科学
AI语言模型首次实现类脑神经元空间功能排列
打磨绝缘层突破机器人触觉测量瓶颈
TeleAbsence:与过去的诗意邂逅
AI系统MOFGen突破金属有机框架材料发现瓶颈
大语言模型决策能力不足:RL微调如何改善贪婪行为与知行差距
脑科学动态
49岁后大脑主动"劝退"运动
为什么49岁后人们运动量急剧下降?东北大学Meishan Ai和Timothy Morris团队通过脑成像研究发现,大脑显著性网络(Salience Network)功能连接减弱是关键因素。该网络负责抑制"躺平"冲动,其功能衰退可解释54%的年龄相关运动下降。
研究团队分析剑桥老龄化研究中心(Cam-CAN)18-81岁人群的脑扫描和运动数据,首次精确锁定49岁为运动量断崖式下降的临界点。通过静息态功能磁共振成像发现,涉及抑制控制(如抵抗沙发诱惑)的显着性网络功能连接强度与运动量高度相关。中介分析显示,当该网络连接右颞顶叶-前扣带回-脑岛等区域时,能显著缓解年龄带来的运动衰退。有趣的是,负责高级认知的前额顶叶网络未显示同样作用,说明运动坚持更多依赖本能抑制而非理性决策。研究为针对性的运动干预提供新靶点。研究发表在 The Journals of Gerontology: Series A 上。
#疾病与健康 #健康管理与寿命延长 #神经机制与脑功能解析 #运动神经科学 #老龄化
阅读更多:
Ai, Meishan, et al. Brain Resting-State Functional Connectivity Mediates the Age-Associated Decline in Physical Activity Engagement. academic.oup.com, https://dx.doi.org/10.1093/gerona/glaf075. Accessed 6 May 2025
5岁儿童已具备"地图导航"能力
儿童何时发展出地图导航能力?埃默里大学的Yaelan Jung和Daniel D. Dilks团队通过创新的"小镇"虚拟实验发现,5岁儿童大脑中负责空间导航的压后皮层已能精确编码位置信息,这一神经证据比传统行为研究预测的年龄提前了7年。
研究团队设计了三区域简化版虚拟城镇"小镇",包含山区、湖区等特征景观和冰淇淋店等儿童熟悉建筑。通过功能磁共振成像记录5岁儿童完成导航任务时的脑活动,发现其压后皮层(RSC,负责空间位置映射)已能区分同一类建筑在不同区域的位置,且神经表征准确反映实际空间布局。特别值得注意的是,RSC仅处理位置信息,而海马旁回位置区(PPA,负责场景分类)则专注于建筑类别识别,这种功能分工与成人完全一致。研究还发现,儿童在虚拟环境中的导航表现与其RSC神经活动模式显著相关。研究发表在 PNAS 上。
#认知科学 #神经机制与脑功能解析 #儿童发展 #空间导航 #fMRI技术
阅读更多:
Jung, Yaelan, and Daniel D. Dilks. “Early Development of Navigationally Relevant Location Information in the Retrosplenial Complex.” Proceedings of the National Academy of Sciences, vol. 122, no. 19, May 2025, p. e2503569122. world, www.pnas.org, https://doi.org/10.1073/pnas.2503569122
左撇子更易患孤独症?大规模研究揭示惯用手与神经疾病的深层关联
为什么左撇子在孤独症患者中更常见?波鸿鲁尔大学的Julian Packheiser和汉堡医学院的Sebastian Ocklenburg领衔的国际团队,通过分析全球40万人的数据发现:伴有语言症状的早期神经发育障碍(如孤独症、阅读障碍)患者中,非右利手比例显著增高,这源于胎儿期大脑功能侧化(brain lateralization)的异常发育。
研究团队对402项既往研究进行二次元分析,涵盖精神分裂症、孤独症谱系障碍(ASD)等12类疾病。通过计算比值比(OR)发现,非右利手在神经发育障碍群体中的发生率比健康人群高46%,其中混合利手(能灵活使用双手)的关联最强(OR=1.63)。深入分析显示,这种关联具有三个关键特征:①仅存在于儿童期显现的疾病(如阅读障碍OR=1.7,成年抑郁症无统计学意义);②伴随语言症状的疾病关联更显著;③症状出现越早,非右利手比例越高。研究者提出"侧化发育时钟"假说——控制惯用手和语言功能的脑区在胚胎期同步发育,相关基因突变或环境干扰可能导致双重异常。研究发表在 Psychological Bulletin 上。
#疾病与健康 #神经机制与脑功能解析 #孤独症 #大脑发育 #语言障碍
阅读更多:
Packheiser, Julian, et al. “Handedness in Mental and Neurodevelopmental Disorders: A Systematic Review and Second-Order Meta-Analysis.” Psychological Bulletin, vol. 151, no. 4, 2025, pp. 476–512. APA PsycNet, https://doi.org/10.1037/bul0000471
全器官免疫细胞基因表达图谱问世
免疫细胞如何在器官中"排兵布阵"?拉霍亚免疫学研究所的Miguel Reina-Campos、Broad研究所的Sami Farhi和哈佛医学院的Christophe Benoist领导的国际团队,通过空间转录组学技术绘制出小鼠全器官免疫细胞分布图谱,并开发开源平台ImmGenMaps,为研究感染、癌症等疾病提供全新视角。
▷人体血液电子显微镜照片中,髓系免疫细胞与红细胞并存。Credit: National Cancer Institute
研究团队采用新一代空间转录组学技术(能同时保留细胞位置和基因表达信息的方法),系统分析了小鼠12个器官中50余万免疫细胞的空间分布。通过结合单细胞RNA测序(scRNA-seq)和40种蛋白质标记物检测,首次揭示粒细胞等易丢失细胞在组织中的真实分布。平台特别关注了基质细胞与免疫细胞的"对话热点",发现肝脏和肺部存在独特的免疫调控微区。研究人员将数据整合为开源三维交互图谱,用户可自由查询特定细胞在肾小球(肾脏过滤单位)或肺泡等精细结构中的基因表达变化。该资源已收录健康状态和5种疾病模型数据,为疫苗开发和肿瘤免疫治疗提供新线索。研究发表在 Nature Immunology 上。
#疾病与健康 #跨学科整合 #免疫图谱 #空间转录组学 #开源数据库
阅读更多:
Reina-Campos, Miguel, et al. “ImmGenMaps, an Open-Source Cartography of the Immune System.” Nature Immunology, vol. 26, no. 5, May 2025, pp. 637–38. www.nature.com, https://doi.org/10.1038/s41590-025-02119-5
你的身体信号在帮你做道德选择,发现内在感知与群体共识的神经联系
韩国大学的JuYoung Kim和Hackjin Kim团队通过实验发现,个体对身体内部信号的感知能力与道德决策密切相关,并首次揭示了相关神经机制。
研究采用心跳感知测试(参与者需准确计数自己心跳次数)和静息态功能磁共振成像,结合经典道德困境问卷。结果显示,能精准感知心跳的参与者,其道德选择与群体共识的一致性高出23%。脑成像数据揭示,这种关联由腹内侧前额叶皮层(vmPFC,负责自我价值评估)和楔前叶(参与内省思考)的协同活动所介导——当这两个脑区在静息状态下的功能连接更强时,身体感知对道德选择的影响更显著。研究还发现该机制不受性别影响,在两组独立实验中均得到验证。这些发现解释了为何有些人更容易内化社会道德规范,也为道德教育的个体化策略提供了神经科学依据。研究发表在 Journal of Neuroscience 上。
#认知科学 #意图与决策 #神经机制与脑功能解析 #跨学科整合
阅读更多:
Kim, JuYoung, and Hackjin Kim. “Neural Processes Linking Interoception to Moral Preferences Aligned with Group Consensus.” Journal of Neuroscience, Apr. 2025. www.jneurosci.org, https://doi.org/10.1523/JNEUROSCI.1114-24.2025
抑郁青少年更易陷入社交媒体比较陷阱
社交媒体如何影响不同心理健康状况的青少年?剑桥大学MRC认知与脑科学部的Luisa Fassi、Amy Orben等团队通过临床级评估发现,有心理健康问题的青少年日均多用50分钟社交媒体,且内化症状群体更易受点赞评论影响情绪。
研究团队分析了英国国家代表性数据(3,340名11-19岁青少年),采用专业临床评估员的多信息源诊断(含家长/教师访谈),对比了有无心理健康问题群体的8个使用维度。结果显示,内化型(如抑郁/焦虑)青少年社交比较(social comparison,指在网络上与他人进行自我对比的行为)行为达48%(普通组24%),28%会因点赞/评论情绪波动(普通组13%),且对网友数量的不满更显著。外化型(如ADHD)群体仅表现使用时长的差异。研究采用高统计标准(参照睡眠/运动与心理健康的已知效应量),证实不同症状群体需要差异化干预策略。研究发表在 Nature Human Behaviour 上。
#疾病与健康 #心理健康与精神疾病 #社交媒体行为 #青少年发展 #临床心理学 #数字健康
阅读更多:
Fassi, Luisa, et al. “Social Media Use in Adolescents with and without Mental Health Conditions.” Nature Human Behaviour, May 2025, pp. 1–17. www.nature.com, https://doi.org/10.1038/s41562-025-02134-4
帕金森病治疗新希望:破解靶向USP30蛋白的抑制剂机制
马克斯·普朗克分子生理学研究所的Malte Gersch团队与Nafizul Haque Kazi等研究人员破解了关键蛋白USP30的结构难题,揭示了小分子抑制剂如何通过独特机制促进线粒体更新,为开发新型帕金森病药物奠定基础。
▷抑制去泛素化酶 USP30 可促进多巴胺能神经细胞中的线粒体自噬,从而促进线粒体更新,这有望为帕金森病的创新疗法奠定基础。Credit: MPI of Molecular Physiology
研究团队采用嵌合蛋白工程(chimeric protein engineering)技术,将USP14和USP35等易结晶去泛素化酶的结构元件"嫁接"到USP30上,成功构建出稳定的蛋白变体。通过X射线晶体衍射技术,团队首次在2.1Å分辨率下解析了USP30与特异性抑制剂NK036的复合物结构。研究发现,抑制剂通过诱导USP30的"开关环"(switching loop)构象变化,打开一个隐藏的结合口袋,同时靶向催化活性位点和特异性热点区域。这种双管齐下的作用机制解释了该抑制剂为何能实现纳摩尔级抑制效力(IC50=2-20nM)和高度选择性——在100μM浓度下对其它去泛素化酶无影响。进一步的氢氘交换质谱(HDX-MS)和热稳定性实验证实,抑制剂与USP30的结合改变了蛋白的动态特性。这项发现不仅解决了USP30长期难以结晶的难题,更揭示了去泛素化酶抑制剂设计的新范式:通过诱导蛋白构象变化来发现特异性结合位点。目前基于该机制的抑制剂已进入帕金森病和慢性肾病的临床试验阶段。研究发表在 Nature Structural & Molecular Biology 上。
#疾病与健康 #神经调控 #个性化医疗 #蛋白质工程 #帕金森病
阅读更多:
Kazi, Nafizul Haque, et al. “Chimeric Deubiquitinase Engineering Reveals Structural Basis for Specific Inhibition of the Mitophagy Regulator USP30.” Nature Structural & Molecular Biology, May 2025, pp. 1–11. www.nature.com, https://doi.org/10.1038/s41594-025-01534-4
你的大脑真实年龄是多少?最新脑功能连接图谱告诉你
大脑如何随年龄变化?北京师范大学Lianglong Sun、Tengda Zhao团队联合全球132个研究中心,通过分析33,250人从胎儿期到80岁的脑成像数据,首次揭示了功能连接强度与多样性分别在40岁和30岁后期达到峰值的规律,并创建了首个全生命周期参考图谱。
研究团队整合了来自人类连接组计划(HCP)等项目的无任务功能磁共振成像数据,覆盖孕后32周至80岁的跨年龄段样本。通过构建系统级脑图谱,发现连接组整体强度在第四十年后期达到拐点,而连接多样性峰值出现在第三十年后期。时空分析显示,大脑发育遵循从初级感觉运动区域向高级联合区域的渐进式模式,不同脑区功能特化存在明显时间差。这些图谱不仅能解释正常发育轨迹,还可量化阿尔茨海默病等神经精神疾病的个体差异。研究发表在 Nature Neuroscience 上。
#疾病与健康 #神经机制与脑功能解析 #跨学科整合 #个性化医疗
阅读更多:
Sun, Lianglong, et al. “Human Lifespan Changes in the Brain’s Functional Connectome.” Nature Neuroscience, vol. 28, no. 4, Apr. 2025, pp. 891–901. www.nature.com, https://doi.org/10.1038/s41593-025-01907-4
AI 行业动态
OpenAI转型公共利益公司
OpenAI宣布将其盈利实体OpenAI for-profit LLC转型为公共利益公司(Public Benefit Corporation, PBC),以平衡商业运营与使命导向。这一调整保留了非营利组织的绝对控制权,同时引入更灵活的股权结构和融资能力,旨在支持通用人工智能(AGI)的全球部署。OpenAI CEO Sam Altman强调,公司核心使命始终是“确保AGI造福全人类”,而非追求利润最大化。新架构将帮助OpenAI应对数千亿美元的算力需求,并推动AI在医疗、教育等领域的民主化应用。
此次转型标志着OpenAI从“封顶利润模式”转向标准股权结构,以吸引更多资本支持模型训练和产品扩展。PBC模式要求公司在盈利的同时兼顾公众利益,这与Anthropic、xAI等AI实验室的选择一致。OpenAI明确表示,非营利组织将继续作为“看门人”防止使命偏离,并通过利润回馈支持全球公共服务。Altman还透露,未来可能开源部分高性能模型,进一步降低AI使用门槛。
ChatGPT的成功已验证AI工具的广泛需求,但当前计算资源仍无法满足全球化使用。OpenAI提出三大目标:获取万亿级资源、强化非营利机构影响力、保障AI安全与透明度。
#OpenAI #AGI #公共利益公司 #AI民主化 #ChatGPT
阅读更多:
https://openai.com/index/evolving-our-structure/
OpenAI 洽谈30亿美元收购AI编程助手Windsurf
OpenAI近日传出将以约30亿美元收购AI编程助手Windsurf(前身为Codeium),这一战略收购标志着其从模型竞争转向生态控制的重大转变。Windsurf以动态代码重构、企业级代码库管理和实时协作功能著称,其技术优势与OpenAI的“氛围编程”愿景高度契合。分析师Charlie Dai指出,此次收购将强化OpenAI在AI辅助开发领域的主导地位,尤其针对受监管行业的低延迟设计和模块化微调需求。交易若完成,将成为OpenAI史上最大规模收购,进一步激化与微软GitHub Copilot、Anthropic等对手的竞争。
此次收购正值AI编程工具市场竞争白热化阶段。微软旗下GitHub Copilot依托代码仓库优势持续升级,Anthropic则通过Claude模型增强编码能力,而风投支持的Cursor等初创公司也在细分领域崭露头角。Counterpoint Research的Neil Shah分析称,Windsurf的加入可能让OpenAI占据AI驱动编程平台市场的主导份额,甚至影响Anthropic与Anysphere的战略合作。此前OpenAI刚完成软银领投的400亿美元融资,估值达3000亿美元,为其战略收购提供了充足弹药。
对于企业用户而言,收购带来的技术整合与未来产品路线图成为关注焦点。分析师Sanchit Vir Gogia强调,Windsurf的IDE原生体验若能与OpenAI生态有机融合,将重塑行业竞争格局;反之,若强行整合为ChatGPT式单体架构,可能适得其反。Forrester的Dai建议企业保持灵活评估策略,在尖端功能与现有生态兼容性间寻求平衡。随着生成式AI编程工具逐步成为软件开发“圣杯”,这场收购或将加速行业效率与准确性的双重革命。
#AI编程助手 #OpenAI #企业生态 #市场竞争 #生成式AI
阅读更多:
https://www.bloomberg.com/news/articles/2025-05-06/openai-reaches-agreement-to-buy-startup-windsurf-for-3-billion
英伟达开源Llama-Nemotron模型家族
英伟达近日推出Llama-Nemotron系列开源模型,基于Meta AI的Llama架构优化,专为高效推理设计。该系列包含Nano(8B)、Super(49B)、Ultra(253B)及支持超长上下文的UltraLong(8B)四个版本,采用开放许可,允许商业使用。模型通过动态推理切换功能,用户可自由切换聊天与推理模式,显著提升交互灵活性。评测显示,LN-Ultra在推理吞吐量和部署效率上远超DeepSeek-R1,成为当前开源领域的佼佼者。
训练方法上,英伟达采用多阶段后训练流程,结合监督微调(SFT)和强化学习(RL)。Qwen与DeepSeek-R1作为关键辅助,前者负责数据生成与清洗,后者作为教师模型迁移深度逻辑能力。独特的Puzzle框架通过神经网络架构搜索(NAS)优化模块,移除冗余注意力层并压缩前馈网络(FFN),实现硬件效率与精度的平衡。LN-Ultra还引入FFN融合技术,降低序列深度,进一步缩短延迟。
部署方面,LN-Super针对单块H100 GPU优化,推理吞吐量提升5倍;LN-Ultra适配8卡H100节点,延迟降低1.71倍。通过强化学习优化科学推理能力,并结合课程化学习策略,模型在复杂任务中表现卓越。最终,LN-Super在Arena Hard评测中得分88.3,超越Claude 3.5 Sonnet等专有模型,验证了其全能性能。
#英伟达 #开源大模型 #推理优化 #Llama-Nemotron #DeepSeek-R1
阅读更多:
https://github.com/NVIDIA/NeMo
谷歌更新了其旗舰大型语言模型Gemini 2.5 Pro Preview(I/O版)
谷歌发布了其旗舰大型语言模型的更新版本——Gemini 2.5 Pro Preview(I/O版)。此次更新显著增强了模型的编码能力,特别是在构建交互式网页应用方面,旨在为开发者提供更强大的工具,以加速应用开发流程。
Gemini 2.5 Pro Preview(I/O版)由谷歌研究团队开发,引入了多项关键改进。首先,模型在代码生成方面表现出色,能够从单一文本提示生成完整的交互式网页应用或模拟程序,极大地降低了开发门槛。其次,模型在代码转换和编辑任务中也显示出更高的准确性和效率,支持开发者更快速地实现功能迭代。此外,Gemini 2.5 Pro Preview(I/O版)在视频理解方面也取得了突破,在VideoMME基准测试中获得了84.8%的高分,展示了其在多模态任务中的强大能力。这些改进使得该模型在LMArena的编码排行榜和WebDev Arena排行榜中均位列第一,进一步证明了其在实际应用中的领先地位。
#大型语言模型 #代码生成 #多模态理解 #网页应用开发
阅读更多:
https://www.xiaohu.ai/c/xiaohu-ai/google-gemini-2-5-pro-i-o
AI 驱动科学
AI语言模型首次实现类脑神经元空间功能排列
大脑神经元如何形成功能与空间的双重组织?瑞士洛桑联邦理工学院Neil Rathi、Johannes Mehrer和Martin Schrimpf团队开发出TopoLM模型,首次在AI中同时复现了神经元的功能聚类与空间排列特性,其预测结果与人脑语言系统高度吻合。
研究团队改造Transformer架构,为每个注意力层和MLP层添加二维空间编码,并引入空间平滑损失(强制相邻人工神经元激活模式相似)。训练后的TopoLM自发形成语义明确的功能簇——如处理动词/名词的单元在空间上分区排列,与fMRI测得的人脑语言区分布一致。模型在BLiMP行为任务中表现略逊于基线,但在脑对齐基准(Brain-Score)上达到同等水平。值得注意的是,这种类脑结构仅通过文本训练形成,未使用任何脑数据拟合。模型还预测出人脑中可能存在但尚未被发现的神经元簇,团队正计划通过成像实验验证。研究为理解大脑语言系统组织原则提供了计算框架,同时提升了AI模型的可解释性。研究发表在 ICLR 2025 上。
#AI驱动科学 #神经机制与脑功能解析 #大模型技术 #计算模型与人工智能模拟 #神经语言学
阅读更多:
Rathi, Neil, et al. TopoLM: Brain-like Spatio-Functional Organization in a Topographic Language Model. arXiv:2410.11516, arXiv, 18 Mar. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2410.11516
打磨绝缘层突破机器人触觉测量瓶颈
廉价机器人皮肤为何难以准确感知?美国西北大学Matthew A. Grayson与以色列特拉维夫大学Noa Lachman领导的跨学科团队发现,硅橡胶复合材料表面存在隐形绝缘层是罪魁祸首。通过简单打磨处理,团队成功将触觉传感器的测量可靠性提升至工业应用标准。
▷绝缘表面层电导率和厚度的电气特性。Credit: Advanced Electronic Materials (2025).
研究首先采用直流电压扫描(DC voltage sweep,测量电流-电压关系的技术)检测碳纳米管复合材料的电接触特性,发现表面存在导致非欧姆接触的绝缘层。交流频率扫描(AC frequency sweep)分析显示该绝缘层厚度约1微米,比电子显微镜观测值厚10倍。团队创新性开发三端测试法,可在所有接触点均为非欧姆性时仍能验证接触质量。通过简单机械打磨去除绝缘层后,接触电阻降低100倍,传感器响应滞后现象消失。扫描电子显微镜(SEM)与电学测量对比证实,该方法能实现深度欧姆接触。研究为柔性电子器件的标准化测试提供了关键技术支持,相关方案已应用于工业机器人触觉系统开发。研究发表在 Advanced Electronic Materials 上。
#AI驱动科学 #跨学科整合 #机器人触觉 #柔性电子 #材料表征
阅读更多:
Onsager, Claire C., et al. Getting Under the Sensor’s Skin: The Importance of Electrical Contact Characterization for Conductive Composite Elastomers. advanced.onlinelibrary.wiley.com, https://doi.org/10.1002/aelm.202400848. Accessed 6 May 2025
TeleAbsence:与过去的诗意邂逅
如何通过技术创造与逝者或过去自我的情感连接?麻省理工学院媒体实验室的有形媒体小组(Tangible Media Group)的Hiroshi Ishii、Xiao Xiao等团队提出TeleAbsence概念,通过五项设计原则和技术实验,探索跨越时间的诗意交流方式。
▷已故坂本龙一于 2024 年 6 月在麻省理工学院媒体实验室的 MirrorFugue 节目中演奏《圣诞快乐,劳伦斯先生》。Credit: Tangible Media Group.
研究提出五项核心设计原则:缺失的存在(presence of absence,通过物理痕迹唤起记忆)、虚幻的交流(illusory communication,如单向诗歌发布)、记忆的物质化(如玻璃瓶中的声音)、反射痕迹(如信件上的笔迹)和遥远时间(营造穿越感)。实验部分通过MirrorFugue项目实现:28名参与者观看幻影钢琴家演奏(包括已故的坂本龙一),传感器记录心率和手部动作,访谈揭示情感体验。结果显示,抽象设计(如模糊影像或空瓶子)比具象重现更能引发共鸣,且参与者是否认识钢琴家显著影响情感强度。研究强调伦理边界,避免制造“幽灵机器人”或延长悲伤。研究发表在 PRESENCE: Virtual and Augmented Reality 上。
#AI驱动科学 #心理健康与精神疾病 #记忆机制 #跨学科整合
阅读更多:
Ishii, Hiroshi, et al. “TeleAbsence: A Vision of Past and Afterlife Telepresence.” PRESENCE: Virtual and Augmented Reality, vol. 34, Mar. 2025, pp. 65–95. Silverchair, https://doi.org/10.1162/PRES_a_00441
AI系统MOFGen突破金属有机框架材料发现瓶颈
如何高效发现可实际合成的金属有机框架(MOFs)材料?加州大学伯克利分校、劳伦斯伯克利国家实验室和Google DeepMind的Théo Jaffrelot Inizan、Sherry Yang、Aaron Kaplan等研究人员开发了MOFGen系统,成功合成五种"AI构想"的MOFs,部分仅需数天完成。
研究团队构建了包含四大智能体的MOFGen系统:大语言模型提出MOF化学组成,扩散模型构建晶体结构,量子力学代理优化稳定性,机器学习代理评估合成可行性。系统整合了所有已报道的MOF实验数据和计算数据库进行训练。结果显示,MOFGen生成了数十万种新型结构,其中五种已通过实验验证,包括具有潜在二氧化碳捕获和水收集应用的材料。特别值得注意的是,传统方法需要数月甚至数年的材料发现流程,被缩短至数天完成。
#AI驱动科学 #自动化科研 #材料科学 #金属有机框架 #二氧化碳捕获
阅读更多:
Inizan, Theo Jaffrelot, et al. System of Agentic AI for the Discovery of Metal-Organic Frameworks. arXiv:2504.14110, arXiv, 18 Apr. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2504.14110
大语言模型决策能力不足:RL微调如何改善贪婪行为与知行差距
大语言模型虽在文本处理表现出色,但在决策任务中常表现不佳。奥地利林茨大学的Thomas Schmied与Google DeepMind团队合作,发现强化学习微调可显著改善模型的探索行为和知行差距问题。
研究团队首先系统分析了LLMs在决策任务中的三种典型失败模式:贪婪行为(过早锁定次优策略)、频率偏差(小模型倾向于选择高频动作)和知行差距(87%的理性分析正确但64%的实际行动仍错误)。为解决这些问题,他们提出基于自生成思维链(Chain-of-Thought)的强化学习微调(RLFT)方法,在老虎机、上下文老虎机和井字棋环境中测试了不同规模(2B/9B/27B参数)的Gemma2模型。结果显示,RLFT显著提高了探索行为,将未探索动作空间从55%降至更低水平;同时,传统RL探索技术(如ε-greedy)和LLM特有方法(如自我一致性)的结合使用效果最佳。研究为提升LLM在自主代理系统中的决策能力提供了重要参考。
#大模型技术 #意图与决策 #AI驱动科学 #强化学习 #知行差距
阅读更多:
Schmied, Thomas, et al. LLMs Are Greedy Agents: Effects of RL Fine-Tuning on Decision-Making Abilities. arXiv:2504.16078, arXiv, 22 Apr. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2504.16078
整理|ChatGPT
编辑|丹雀、存源
关于追问nextquestion
天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。如果您有进一步想要讨论的内容,欢迎评论区留言,或后台留言“社群”即可加入社群与我们互动。
关于天桥脑科学研究院
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。
Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。
Chen Institute建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、等。

