【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新性地提出了一种「拖拽式大语言模型」(DnD),它可以基于提示词快速生成模型参数,无需微调就能适应任务。不仅效率最高提升12000倍,而且具备出色的零样本泛化能力。 刚刚,包括尤洋教授在内的来自新加坡国立大学、得克萨斯大学奥斯汀分校等机构的研究人员,提出了一种全新的「拖拽式大语言模型」——Drag-and-Drop LLMs! 通过一个轻量级文本编码器与一个级联超卷积解码器的组合,DnD能在数秒内,仅根据无标签的任务提示词,生成针对该任务的LoRA权重矩阵。 通过观察,研究人员发现,LoRA适配器无非是其训练数据的一个函数:梯度下降会将基础权重「拖拽」至一个特定任务的最优状态。 为了赋予模型「拖拽」的能力,团队将这些数据集的提示词与收集到的LoRA权重进行随机配对,构成DnD模型的训练数据——即「提示词-参数」对。 在推理阶段,团队只需将来自全新数据集(训练中未见过)的提示词输入DnD,仅需一次前向传播,即可获得为该任务量身定制的参数。 实验结果表明,在零样本测试集上,团队的方法相较于训练所用的LoRA模型的平均性能,取得了惊人的提升,并且能够很好地泛化到多种真实世界任务和不同尺寸的LLM。 此前,他在中国科学技术大学获得人工智能学士学位。并曾在北卡罗来纳大学教堂山分校Huaxiu Yao教授的指导下进行实习,以及在中国科学技术大学数据科学实验室跟着导师Xiang Wang度过了两年的时光。 Zhangyang Wang目前是德克萨斯大学奥斯汀分校钱德拉家族电气与计算机工程系的终身副教授,并荣膺坦普尔顿基金会第7号捐赠教席。 他于2016年获伊利诺伊大学厄巴纳-香槟分校电气与计算机工程博士学位,师从计算机视觉泰斗黄煦涛(Thomas S.Huang)教授;并于2012年获中国科学技术大学电子工程与信息科学学士学位。 核心目标是创建结构化、模块化的模型表示:1)在过参数化模型空间中实现高效、鲁棒的学习;2)与符号知识及推理进行无缝连接。 此前,他在新加坡国立大学获得数据科学与机器学习博士学位,在中国科学院深圳先进技术研究院获得计算机技术硕士学位,在北京师范大学珠海校区获得学士学位。
成都私人情侣免费看电视剧的软件IT之家 6 月 14 日消息,广东移动与华为于 6 月 12 日共同推出了全国首个 5G-A 高铁专网加速服务,支持游戏、直播等 5 类 26 个常用 App 的精准识别、质差判断及动态加速服务。据中央纪委国家监委网站消息,江西省人大常委会原党组副书记、副主任洪礼和严重违纪违法被开除党籍;中国大唐原党组副书记、总经理寇伟严重违纪违法被开除党籍。成都私人情侣免费看电视剧的软件成品网站免费直播有哪些平台推荐世俱杯开打至今,南美球队整体表现出色,帕尔梅拉斯在A组排名榜首,博塔弗戈更是将欧冠冠军大巴黎斩落马下,弗拉门戈也不甘示弱,首战2-0轻取突尼斯希望。弗拉门戈的这场逆转之战,打得相当漂亮。从场面上看,弗拉门戈进攻犀利,打法富有激情,渴望胜利。切尔西的攻防都存在严重问题:组织核心帕尔默全场隐身,中锋杰克逊出场仅4分钟就染红,简直是新版的“没头脑”和“不高兴”。
20250818 😏 成都私人情侣免费看电视剧的软件齐沃即将出任国米新主帅,而冈茨对此表示:“这是勇敢的选择,因为齐沃在国米青训执教时取得了出色的成绩,还成功率领帕尔马保级。我认为这个选择是勇敢的,但对于马洛塔和那些选择齐沃的人来说,这肯定是正确的选择。”乳头被男人吸过乳头会皲裂吗比如:这台新型计算机是什么?它长什么样?生态系统又是怎样的?多年前吴恩达(Andrew Ng)的一句话让我印象深刻(他应该在我之后发言),他说:「AI 是新型电力。」
📸 文忠记者 姜滢 摄
20250818 😘 成都私人情侣免费看电视剧的软件韦尔斯在4月11日接受了手腕修复手术后很快就进入了训练模式,他在下赛季前大概率就能恢复健康,灰熊队未来的核心就是新三人组——莫兰特、韦尔斯、小贾伦。最好看的日本MV片视频路透社称,以色列军方于当地时间24日晚解除了全国范围内的活动限制,有官员称位于特拉维夫附近的该国主要机场本-古里安国际机场已重新开放。据伊朗媒体报道,伊朗领空也将重新开放。一名白宫官员称,特朗普与内塔尼亚胡促成了停火协议,政府其他官员也在与伊朗政府保持接触。但路透社认为,停火协议很脆弱:以色列和伊朗都耗时数小时才承认接受停火,并互相指责对方违反协议。
📸 林涛记者 戴自富 摄
🍆 雷军曾感慨小米造车“刚刚好”,道破了时机的重要性。对于2025年才入场的新玩家而言,他们面对的是巨头割据、规则森严、资源固化的残酷角斗场。他们若想存活,唯有手握不可替代的王牌,在巨头尚未触及的细分领域奋力一搏。这注定是一场艰难的生存挑战,绝大多数新入局者终将止步场外。九·幺.9.1