【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新性地提出了一种「拖拽式大语言模型」(DnD),它可以基于提示词快速生成模型参数,无需微调就能适应任务。不仅效率最高提升12000倍,而且具备出色的零样本泛化能力。 刚刚,包括尤洋教授在内的来自新加坡国立大学、得克萨斯大学奥斯汀分校等机构的研究人员,提出了一种全新的「拖拽式大语言模型」——Drag-and-Drop LLMs! 通过一个轻量级文本编码器与一个级联超卷积解码器的组合,DnD能在数秒内,仅根据无标签的任务提示词,生成针对该任务的LoRA权重矩阵。 通过观察,研究人员发现,LoRA适配器无非是其训练数据的一个函数:梯度下降会将基础权重「拖拽」至一个特定任务的最优状态。 为了赋予模型「拖拽」的能力,团队将这些数据集的提示词与收集到的LoRA权重进行随机配对,构成DnD模型的训练数据——即「提示词-参数」对。 在推理阶段,团队只需将来自全新数据集(训练中未见过)的提示词输入DnD,仅需一次前向传播,即可获得为该任务量身定制的参数。 实验结果表明,在零样本测试集上,团队的方法相较于训练所用的LoRA模型的平均性能,取得了惊人的提升,并且能够很好地泛化到多种真实世界任务和不同尺寸的LLM。 此前,他在中国科学技术大学获得人工智能学士学位。并曾在北卡罗来纳大学教堂山分校Huaxiu Yao教授的指导下进行实习,以及在中国科学技术大学数据科学实验室跟着导师Xiang Wang度过了两年的时光。 Zhangyang Wang目前是德克萨斯大学奥斯汀分校钱德拉家族电气与计算机工程系的终身副教授,并荣膺坦普尔顿基金会第7号捐赠教席。 他于2016年获伊利诺伊大学厄巴纳-香槟分校电气与计算机工程博士学位,师从计算机视觉泰斗黄煦涛(Thomas S.Huang)教授;并于2012年获中国科学技术大学电子工程与信息科学学士学位。 核心目标是创建结构化、模块化的模型表示:1)在过参数化模型空间中实现高效、鲁棒的学习;2)与符号知识及推理进行无缝连接。 此前,他在新加坡国立大学获得数据科学与机器学习博士学位,在中国科学院深圳先进技术研究院获得计算机技术硕士学位,在北京师范大学珠海校区获得学士学位。
《宝宝下面湿透了还嘴硬的原因》简言之,这台新汽车已经足够好,但一汽丰田觉得,还不够好。所以,上市发布会最大的亮点之一,就是8项权益的推出,字面上涉及了购车、用车、服务三种,综合总价值超3.8万元。但拆开解读来看,这同样藏着关于新汽车和新技术的戏份。IT之家援引博文介绍,谷歌官方表示,Gemini 2.5 Flash 和 Gemini 2.5 Pro 两款模型已通过大规模测试,可稳定支持生产级应用开发。Spline、Rooms 等公司,以及 Snap、SmartBear 等企业,已在过去数周内使用最新版本开发实际应用。《宝宝下面湿透了还嘴硬的原因》亚洲l码和欧洲m码的区别据报道,曼联已与法兰克福就签下埃基蒂克展开了初步谈判。虽然曼联尚未提出正式报价,但俱乐部正在探讨这笔交易的条件。2025年世俱杯小组赛第二轮,皇家马德里对阵帕丘卡,上半场战罢,皇马2-0领先对手,至此,皇马本赛季各项赛事已打入140球,这是皇马自2017-18赛季以来首次做到这一点。
20250819 😈 《宝宝下面湿透了还嘴硬的原因》伊朗炮击的强度似乎已经在急剧下降。在上周五冲突的第一个晚上发射了150多枚导弹后,伊朗在周二下午又发射了10枚导弹。满18岁免费观看高清电视剧推荐“在俱乐部层面,这是最引人注目也是最重要的比赛。因为对手及其所代表的一切。我们在世俱杯上赌上了很多。皇马是每项赛事的夺冠热门,我们将竭尽全力争取胜利。我们没有明天了。”
📸 任甜记者 张帅 摄
20250819 🔞 《宝宝下面湿透了还嘴硬的原因》追觅科技经多方提供线索及相关证据发现,相关内容存在有组织网络水军、“黑公关”、“黑媒体”特征,并与多家公司及其高管有关,线下还发生多起涉及雇佣第三方人员偷拍商业机密、打击报复追觅员工等违法行为。免费网站在线观看人数在哪软件2025年6月24日,上海市科学技术委员会发布了关于发布2025年度关键技术研发计划“农业科技”项目申报指南的通知。为深入实施创新驱动发展战略,加快建设具有全球影响力的科技创新中心,根据《上海市建设具有全球影响力的科技创新中心“十四五”规划》,上海市科学技术委员会特发布2025年度关键技术研发计划“农业科技”项目申报指南。网上申报时间:2025年7月2日起至7月21日。(详情可点击跳转链接)
📸 张金峰记者 叶秋明 摄
❤️ 克服高原、高寒、高地震烈度、高地应力的施工难度,中吉乌铁路吉尔吉斯斯坦境内段重点控制性工程于今年4月正式开工建设,标志着中吉乌铁路项目正线工程进入实质性施工阶段。宝宝下面湿透了还嘴硬的原因