YannLeCun这波是真没让人失望,之前还传他可能要从Meta辞职,加上Meta一直被审核规定折腾得够呛,本以为他的科研节奏得慢下来,结果人家直接带...
2025-10-11 0
YannLeCun这波是真没让人失望,之前还传他可能要从Meta辞职,加上Meta一直被审核规定折腾得够呛,本以为他的科研节奏得慢下来,结果人家直接带着最新论文冲了出来,还是和三位FAIR的同事一起搞的。
这次研究最关键的发现,说出来你可能会惊讶,自监督模型JEPAs居然藏着个“隐藏技能”,它居然学会认数据的“密度”了。说白了就是能分清哪些数据常见,哪些少见,甚至是异常的。本来学界都觉得JEPAs就只会提取特征,跟数据密度没啥关系,这下直接把这个老观点给推翻了。
要搞懂这个突破到底有多重要,得先说说JEPAs是啥,这是LeCun团队近几年重点推的自监督学习框架,最大的好处就是不用人手动给数据标标签,模型自己就能从海量数据里学规律,学完了就能直接用在图像识别、跨模态匹配这些下游任务上,在AI圈里算是高效学习的代表。老实讲,之前我也觉得这模型就是个“特征提取器”,没多想它还能搞别的,结果这次研究还真给了个大惊喜。
之前大家都知道JEPAs训练有两个核心目标,其中一个就是“反坍缩”,啥是反坍缩,要是所有数据的特征都变得一模一样,那模型等于白学一场,反坍缩就是防止出现这种情况,保证特征有用。本来想简单说这就是个“防出错”的功能,但后来发现这么说太浅了,LeCun团队盯着反坍缩的价值深挖,用变量替换公式和高维统计特性推导,最后证明反坍缩不光能防特征坍缩,还能让JEPAs精准学数据密度。
说实话,之前有些AI模型训练时就容易出特征坍缩的问题,比如早期的ViT模型在小数据集上练,特征就容易变得差不多,跟把各种颜色混成灰色似的,只能靠加正则化项解决,效果还一般。现在JEPAs靠反坍缩不仅解决了这问题,还顺带学了数据密度,这就相当于一举两得。我觉得这挺有意思的,搞科研有时候就像挖宝藏,本来冲着一个目标去,结果在旁边又发现了新宝贝。
而且从理论上看,这还不是偶然,当JEPAs输出高斯嵌入(就是高维空间里像在超球面上均匀分布的特征)时,必须靠雅可比矩阵感知数据密度,才能满足训练的约束条件。这么看来,JEPAs学数据密度是必然的,之前没发现只是大家没往这方面想而已。
光在理论上证明了还不够,得有个能落地用的工具才行,不然这“隐藏技能”再厉害也没法发挥作用。所以LeCun团队又搞出了JEPA-SCORE,这东西就是从JEPAs里提取数据密度的量化指标,核心作用就是给样本的常见度打分。
JEPA-SCORE的计算逻辑其实不复杂,就是拿JEPAs处理样本时的雅可比矩阵,算出矩阵的特征值,再取对数求和,结果就是JEPA-SCORE。分数高的就是常见样本,分数低的就是少见或异常的。本来我还担心计算会不会很麻烦,得调一堆参数,结果发现挺简洁高效的,不用额外费功夫。
更厉害的是这工具还特“百搭”,不管啥数据集都能用,像ImageNet、手写数字MNIST,甚至是没参与过预训练的星云图集,它都能精准计算。而且不管是I-JEPA、DINOv2这种单模态视觉模型,还是MetaCLIP这种多模态模型,只要是训练好的JEPAs家族模型,都能直接用,不用再额外训模型。
老实讲,这一点太圈粉了,有些工具挑数据集挑模型,换个场景就得重新调,用着特别费劲,JEPA-SCORE就没这毛病。之前我查过,传统的datadensity量化工具比如核密度估计KDE,在大数据集上算得挺慢的,JEPA-SCORE比它快不少,这在实际应用里太重要了,要是处理个数据得等半天,效率就太低了。
当然,光说好用不算数,得有实验证明才行,不然就是空口说白话,团队搞了好几组实验,结果都挺能打的。在ImageNet数据集里,不同的JEPAs模型对常见的飞行鸟类样本和少见的栖息鸟类样本,JEPA-SCORE的判定都差不多,说明这是JEPAs的共性能力,不是某个模型碰巧做到的。
面对没参与过预训练的星系图像数据集,JEPA-SCORE的分数明显比ImageNet低,说明模型能精准认出陌生数据。而且在数据筛选和异常检测的实用测试里,它的效果也比传统方法好。说实话,这就让我觉得这研究不是停留在纸面上,是真的能用到实际场景里的,比如以后用来筛数据、找异常,都能省不少事。
这次研究也不是LeCun一个人的功劳,另外三位核心研究者都是MetaFAIR的人,个个都有两把刷子。RandallBalestriero是布朗大学的计算机科学助理教授,从2013年就研究可学习信号处理,他参与的技术还用过在NASA火星车的火星地震探测上;NicolasBallas有法国格勒诺布尔大学的博士学位,2017年就进了FAIR当研究科学家,现在都待了八年多了。
MichaelRabbat是FAIR的创始成员,学历背景也硬,研究方向聚焦优化算法、分布式算法和信号处理,之前还在麦吉尔大学当教授。看这团队配置就知道,能出这成果不是偶然,每个人都有自己擅长的领域,凑在一起就能从不同角度发力,把研究做深做透。有时候搞技术就是这样,单靠一个人很难有大突破,团队的互补太重要了。
总的来说,这次LeCun团队的研究不光打破了学界对JEPAs的传统认知,还给出了JEPA-SCORE这么实用的工具,而且有扎实的实验和强大的团队背书,可信度很高。更难得的是,在Meta受审核规定“折磨”的情况下,FAIR团队还能保持这样的科研节奏,拿出这么有价值的成果,这份韧性挺让人佩服的。
以后这技术要是用在医疗影像异常检测、自动驾驶数据清洗这些地方,应该能发挥不少作用,我还挺期待后续他们能再挖挖JEPAs的其他“隐藏技能”的,毕竟这次能发现学数据密度,保不齐下次还有新惊喜呢。
相关文章
YannLeCun这波是真没让人失望,之前还传他可能要从Meta辞职,加上Meta一直被审核规定折腾得够呛,本以为他的科研节奏得慢下来,结果人家直接带...
2025-10-11 0
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-10-11 0
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-10-11 0
为进一步弘扬科学精神、普及科学知识,让科普资源惠及更多基层群众,9月28日,市科技馆科普大篷车满载着丰富的科普展品和互动体验项目,走进康巴什平安社区,...
2025-10-11 0
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-10-11 0
【无需打开直接搜索微信;-】 操作使用教程: 1.亲,实际上微乐湖北麻将万能开挂器是可以开挂的,确实有挂.2.在"设置D...
2025-10-11 0
本篇文章给大家谈谈请问“雀神麻将小程序开挂”—图解开挂技巧,以及对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 微信雀神麻将小程序技巧 1、心...
2025-10-11 0
最近,中国科学家在对嫦娥六号带回的月背月壤进行研究时,发现了一个令人惊讶的现象:月球背面的月幔温度竟然比正面低了约100摄氏度!这个发现就像揭开了月球...
2025-10-11 0
发表评论