English
邮箱
联系我们
网站地图
邮箱
旧版回顾



大型游戏平台排行榜:领馆之夜:成都以艺术对话世界

文章来源:大型游戏平台排行榜    发布时间:2018年10月20日 13:32  【字号:      】

大型游戏平台排行榜

秦川看了下舞池里那些正在翩翩起舞的女人,她们脸上虽说挂着笑容,但笑容里却隐含着恐惧。再看看带着她们一起来的法国男人,脸上尽是无奈和尴尬。

秦川很不喜欢这种氛围,于是就乘着斯莱因上校与几个军官交谈的时候走了出去……

在晚风中点燃一根烟,秦川独自一人走进旁边的花园小道。

音乐的喧哗渐渐消逝,取而代之的是草丛中昆虫的叫声,这让秦川感觉好多了……这或许是从战场上下来的军人的职业病:

战场太吵了,所以他们更喜欢安静的地方;

体育招聘|中超公司、体奥动力、恒健国际等7家公司25个岗位

天行达阵

我们是天行达阵(中国)橄榄球学院(SKYWAY Football Academy (China),以 下简称“天行达阵”) 成立于2015年,是中国一所青少年橄榄球教育机构。公司成立三年多的时间里,共计培养9000余名橄榄球青少年学员,10000余人次参与其组织的培训及体验活动,成为国内具影响力的橄榄球推广机构之一。

在佛山分公司,我们拥有全国唯一一座自建的标准的美式橄榄球场;同 时我们也有自己的成人橄榄球队-佛山兕虎。另由公司培训的 Tiger队与Eagle队代表佛山外国语学院取得2015NFL中国腰旗橄榄球邀请赛总决赛冠军与季军。

“因为……”秦川望了法国士兵一眼,然后接着说道:“记得我告诉过你们,德国会取得这场战争的胜利吗?你们一定以为我是在欺骗你们,是吗?英国人有飞机、有大炮,还有数不清的坦克……他们甚至把我们一路从亚历山大赶到了这里,而且还突破了我们的防线,德国怎么可能打赢这场战争?!”

秦川笑了下,然后接着说道:“但你们不知道,这是我们为英国人布下的一个陷阱,一个大陷阱……英国人大批坦克、飞机和大炮正在往这个陷阱里掉!”

博杜安意识到了什么,他半信半疑的说道:“中尉,你是说……一旦我们钻出地面占领零号高地,英国人就会被我们包围在防线内了?”

“很好,博杜安!”秦川回答:“你至少猜中一半了,加夫萨以及零号高地的失守,都是我们有意而为之,否则你们以为英国人会这么容易就拿下零号高地吗?”

法国士兵们不由纷纷点头,他们都参与了零号高地建设,当然知道坑道工事这个防御体系不像表面看起来那么简单。

《华尔街日报》援引知情人士说法称,蚂蚁金服的投资者必须同意不投由腾讯、京东等主要竞争对手控制的公司,或同意不提高已有持股。

蚂蚁金服Pre-IPO融资接近完成:传90亿美元 GIC领投

对此,有接近蚂蚁金服的人士解释称,蚂蚁金服对这轮投资者设定的最主要一条限制更准确和合理的约定应该是——腾讯控股的企业不能投。

中国证券报披露,此轮融资为蚂蚁金服上市前最后一轮私募融资,并表示蚂蚁金服希望明后年能在香港和A股同时上市。

2015年7月,蚂蚁金服完成 A 轮融资,总额接近 18.5 亿美元,由全国社保基金、国开金融等机构参投;

2016 年 4 月,蚂蚁金服完成 B 轮融资,总额超过45亿美元,由建行旗下中投海外和建信信托、中国人寿、中邮集团等机构参投。

“可以这么说!”秦川点了点头。

“上帝!”女少校用一副夸张的表情说道:“你们是战士,你还有这么多部下,为什么不带着你的部下拿起步枪出去把那些可恶的英国人赶走?”

“好主意!”秦川把步枪往女少校面前一送,说道:“女士优先,而且你还是我们的长官!”

士兵们再次笑了起来。

“不不,中尉!”女少校说:“你们不觉得在这里等敌人离开很愚蠢吗?他们或许永远都不会离开,而我们却会饿死在这里,想想你们的亲人,你们的孩子……”

秦川一直不愿意在坑道里吸烟,因为这会让原本就浑浊的空气变得更糟糕,但他还是忍不住点燃了一根……那是从维妮特那缴来的红色高卢。

一边抽着烟秦川就一边考虑着:

这些法国人,他们没有很强的战斗意愿,甚至他们心中始终抱着一丝希望,那就是还能与英国成为盟友……尽管他们嘴上没说出来,但秦川知道他们有这样的念头。

尤其还是,现在盟军已经打到了突尼斯而且攻势很猛,而德军却要像老鼠一样躲在坑道里。

这让他们以为盟军终将取得胜利,于是不可能会死心踏地的为德军卖命。本论文研究者认为解决该问题的关键在于通信,这可以增强策略间的协调。MARL 中有一些学习通信的方法,包括 DIAL [3]、CommNet [23]、BiCNet [18] 和 master-slave [7]。然而,现有方法所采用的智能体之间共享的信息或是预定义的通信架构是有问题的。当存在大量智能体时,智能体很难从全局共享的信息中区分出有助于协同决策的有价值的信息,因此通信几乎毫无帮助甚至可能危及协同学习。此外,在实际应用中,由于接收大量信息需要大量的带宽从而引起长时间的延迟和高计算复杂度,因此所有智能体之间彼此的通信是十分昂贵的。像 master-slave [7] 这样的预定义通信架构可能有所帮助,但是它们限定特定智能体之间的通信,因而限制了潜在的合作可能性。

学界|北京大学提出注意力通信模型ATOC,助力多智能体协作

为了解决这些困难,本论文提出了一种名为 ATOC 的注意力通信模型,使智能体在大型 MARL 的部分可观测分布式环境下学习高效的通信。受视觉注意力循环模型的启发,研究者设计了一种注意力单元,它可以接收编码局部观测结果和某个智能体的行动意图,并决定该智能体是否要与其他智能体进行通信并在可观测区域内合作。如果智能体选择合作,则称其为发起者,它会为了协调策略选择协作者来组成一个通信组。通信组进行动态变化,仅在必要时保持不变。研究者利用双向 LSTM 单元作为信道来连接通信组内的所有智能体。LSTM 单元将内部状态(即编码局部观测结果和行动意图)作为输入并返回指导智能体进行协调策略的指令。与 CommNet 和 BiCNet 分别计算内部状态的算术平均值和加权平均值不同,LSTM 单元有选择地输出用于协作决策的重要信息,这使得智能体能够在动态通信环境中学习协调策略。

研究者将 ATOC 实现为端到端训练的 actor-critic 模型的扩展。在测试阶段,所有智能体共享策略网络、注意力单元和信道,因此 ATOC 在大量智能体的情况下具备很好的扩展性。研究者在三个场景中通过实验展示了 ATOC 的成功,分别对应于局部奖励、共享全局奖励和竞争性奖励下的智能体协作。与现有的方法相比,ATOC 智能体被证明能够开发出更协调复杂的策略,并具备更好的可扩展性(即在测试阶段添加更多智能体)。据研究者所知,这是注意力通信首次成功地应用于 MARL。

图 1:ATOC 架构。

图 2:实验场景图示:协作导航(左)、协作推球(中)、捕食者-猎物(右)。




(责任编辑:贾奕)

附件:

专题推荐

相关新闻


© 1996 - 2017 中国科学院 版权所有 京ICP备05002857号  京公网安备110402500047号 

网站地图    地址:北京市三里河路52号 邮编:100864