500万彩票网-最新备用app

伯克利宇宙学家在机器学习的挑战顶级竞争者

周五,二〇二〇年三月二十日

在寻找新粒子,物理学家可以依靠的理论预言暗示一些好地方的外观和一些好方法找到他们:这就像被交给隐藏在大海捞针的草图。

但盲目搜索是一个复杂得多,就像大海捞针狩猎不知道你在找什么。

找一下传统的计算机算法和科学家可以在粒子对撞机实验收集的数据量巨大忽视,粒子物理学界正转向机器学习,人工智能的应用程序,它可以教自己,以提高其搜索技术,因为它进行筛选,通过数据的一个干草堆。

在被称为2020年的大型强子对撞机(LHC)奥运会机器学习的挑战,从美国队宇宙学家能源的劳伦斯伯克利国家实验室(伯克利实验室)的部门开发一个代码,最好的识别隐藏在模拟粒子碰撞数据的模拟信号。

宇宙学家?那就对了。

“这是完全出乎意料的为我们表演得这么好,”乔治·斯坦,谁参加了挑战伯克利实验室和500万彩票网备用app的博士后研究员 罗斯·塞尔杰克,一伯克利实验室宇宙学家,500万彩票网备用app教授,伯克利中心宇宙物理学,其中斯坦是一个成员的共同主任。

十支球队,大部分的粒子物理学家,在竞争中竞争,从十一月跑组成。 19,2019年,到一月12年,2020年。

斯坦率领的两个其他学生研究者们下seljak的方向开发的代码适应。该比赛由机器学习为喷气机2020(ml4jets2020)会议的组织者推出。射流在颗粒的碰撞实验产生的粒子物理学家可以追溯到衡量其粒子源的性质的颗粒的窄锥。

比赛结果的会议,这是在纽约大学举行一月期间公布。 15-17。

本纳赫曼,一伯克利实验室的博士后研究员谁是一组的一部分阿特拉斯工程 - 大探测器在CERN的LHC - 担任活动和竞赛组织者之一。大卫施,在罗格斯大学物理学和天文学教授现在在休假伯克利实验室,格里高尔kasieczka,汉堡在德国的大学教授,是协办单位。

而一些计算比赛让参与者提交,并多次以计测试他们的代码,他们是否正在接近正确的结果,2020年LHC奥运会比赛给球队只需进行一次拍摄提交解决方案。

“很酷的事情是,我们没有使用过的,现成的工具,” seljak说。 “我们使用,我们已经为我们的研究开发的一个工具。”

他指出,“在我的组中,我们一直在研究无监督的机器学习。这个想法是,你要在数据没有任何标签来描述数据。”

该团队使用的工具被称为切片迭代优化运输。 “它的深度学习的一种形式,但在这里我们立刻不优化的一切形式,” seljak说。 “相反,我们做迭代”的阶段。

代码非常有效,它可以简单的台式机或笔记本电脑上运行。它是为被称为贝叶斯证据统计方法的发展。

seljak说,“假设你正在寻找在一星球上的运输时间异常”,就需要对地球的时间在一个更大的物体的前传,从你的观点 - 就像从地球上看着太阳的前汞移动。

“一个解决方案要求有一个额外的行星,”他说,”其他的解决方案需要额外的月亮,它们都很好地拟合数据,但是他们有很不同的参数。我如何比较这两种办法呢?”

贝叶斯方法是计算这两种解决方案的证据,看哪个方案具有真正的概率较高。

“这样一个例子来了所有的时间,” seljak说,和他的团队的代码的目的是加快传统方法所需的复杂的计算。 “我们试图在粒子物理学中的一些不相关的改进,我们意识到这可能是用来作为一般的机器学习工具。”

他补充说,“我们的解决方案尤其适用于所谓的异常检测:在比它的其他数据有些不同的数据查找非常微小的信号”

在2020 LHC奥运会比赛,参与者第一接收到的样本集的数据调出从一些背景数据粒子信号的数据 - 这两个针和干草堆 - ,允许参与者以测试它们的代码。

然后他们收到了实际的“黑匣子”竞赛数据:刚刚干草堆。他们负责寻找不同的,完全不知道那种隐藏在后台的数据粒子信号,并具体介绍了信号的事件,他们的方法出现了。

大赛协办石和纳赫曼指出,他们曾亲自一直在使用一个非常类似的方法(称为“有条件密度估计”)由seljak和Stein开发的技术,在竞争进入了一个异常的检测方法。

seljak和Stein与一些粒子物理学家在实验室咨询,包括纳赫曼,石,和研究生帕特里克·麦科马克。他们讨论其他议题,高能量物理学界通常如何分析像那些在竞争中使用的数据集之间,但实际的“黑盒子”的挑战seljak和Stein是自己。

由于比赛是朝着接近绘画,斯坦说,“我们认为我们找到了大约一个星期的最后期限之前。”

斯坦和seljak提交了成果发布会前几天,“但我们不是粒子物理学家,我们不打算在会议参加,” seljak说。

然后,斯坦因从会议组织者,谁问他飞了出去,并提出在本周晚些时候团队的解决方案讲座收到一封电子邮件。直到所有扬声器的阐述了自己的结果,主办方不同意比赛的结果。

“我的谈话本来是第一,然后在会议开始前不久,他们让我感动到最后。我不知道这是否是一件好事,”斯坦说。

该伯克利实验室团队输入拿起约1000个场次,加上或减去200的误差,以及正确的响应代码为843点的事件。他们的代码是该类别中的赢家。

几支球队都在估算的能量水平,或接近“共振质谱”的信号,而伯克利实验室团队在共振质谱所作的估计最接近从主信号所产生的辅助信号。

在会议上,斯坦指出,“当时在我们采取的总体思路巨大的利益。它掀起了波澜“。

盎司阿姆拉姆,在大赛中另一个竞争对手,在推特发布,打趣说:“在LHC奥运会的结果是......宇宙学家都在我们的工作比我们更好的。”但大赛主办方没有正式宣布获胜者。

纳赫曼,活动主办方之一,他说,“即使乔治和UROS明显优于其他竞争对手,最终很可能没有一个算法将覆盖所有的可能性 - 所以我们需要多样化的方法来实现广泛的灵敏度“。

他补充说,“粒子物理学进入了一个有趣的时间,其中的新粒子每次预测我们在大型强子对撞机试验迄今已被证明在自然界中未实现的 - 除了粒子物理学的标准模型。而有必要继续的模型驱动的搜索程序,我们也有开发并行程序是模型无关。这是对这一挑战的动机“。

seljak说,他的团队正计划发表一篇论文,详细介绍了机器学习代码。

“我们肯定计划于适用于许多天体物理学的问题,”他说。 “我们将寻找有趣的应用 - 与毛刺或瞬变,任何异常东西。我们将努力加快代码,并使其功能更强大。这类方法真的可以帮助“。

编辑: 
格伦·罗伯茨JR。
研究领域: