分类
如何阅读烛台图

多种不同的平台为交易者提供更多更灵活的选择

独角兽企业如何判断IPO是正确的战略选择

Over 20 years of experience in the corporate finance field: IPO, M&A, private equity, venture capital and mezzanine finance. IPO thought leader.

显示相关资源

EY guide to going public (pdf)

In the world of unicorns, when is the right time to take the leap from private to public? (pdf)

越来越多的独角兽公司选择首次公开募股(IPO)。为什么?为什么选择现在这个时机?他们应该做什么准备呢?

独角兽企业面临的选项很多,何去何从的抉择很复杂

保持私营性质。对于许多独角兽公司的创始人而言,保持私营性质很诱人。考虑到市场上仍有大量流动性,并且更多的投资者愿意将越来越多的资金注入独角兽公司,因此创始人可能更倾向于保持自主权,将公司置于公众的视线之外。但是,保持私营性质可能意味着限制公司未来的发展。而且,独角兽公司终将在某一时点为其金融合作伙伴提供投资回报。

寻找买家。若选择不再保持私营性质,一些快速发展的独角兽企业可能会选择收购而非IPO。寻找拥有雄厚财力和规模的老牌公司来代替自己动手打造,可使独角兽公司更快地实现其增长潜力。这个选项的缺点是,大多数大型组织固有的缓慢步伐和官僚主义可能磨灭独角兽公司蓬勃发展的企业家精神,这一点对对于创始人而言尤为明显。

IPO发行。首次公开募股 的主要优势是,它可以提供独角兽公司的资本量级在其他地方是找不到的。这使得独角兽公司及其创始人有机会奖励和留住对他们的成功至关重要的人才。它为投资者提供了实现投资回报的机会,并可以提升品牌形象并打开新客户的市场。申请上市要求独角兽公司建立起治理结构并拥有专业水平,以证明公司是资本市场上的合规企业。但独角兽公司也会因此面临来自投资者和监管机关的前所未有的力度的审查,而独角兽公司可能对此始料未及。

直接上市是上市的另一种方式。直接上市为独角兽企业提供了另一种进入公共市场的战略途径。独角兽企业可以直接发行现有股权而无需发行新股票。但是,直接上市并不适合所有企业。企业规模是重要因素。直接上市对于已经享有品牌知名度和可观的私募市场估值的颠覆者(例如独角兽企业)非常有利。直接上市可以进一步加强品牌知名度,并对独角兽企业的权益价值建立信心。还可以选择第二步发行新股以筹集更多资金。

多种不同的平台为交易者提供更多更灵活的选择

作者:蛋酱

可以看到,不管是谷歌、微软、IBM 等全球科技巨头,还是国内一众 AI 龙头企业,在学术研究和产业落地上,它们的关注焦点都在从智能感知向智能决策过渡。「决策 AI」成了领域内的必争之地。

今年 5 月,谷歌旗下的机构 DeepMind 发布 Gato,这款全新的 AI 智能体能够在「广泛的环境中」完成 604 项不同的任务。Gato 多种不同的平台为交易者提供更多更灵活的选择 的诞生,再次刷新了单智能体的能力上限。当然,关于 AI 决策能力的探索不会仅限于此,如果让海量智能体在一个接近真实世界的开放决策环境中「狭路相逢」,它们会做出何种判断和选择,又会怎样分工合作、竞争呢?

近日,由超参数科技发起,麻省理工学院、清华大学深圳国际研究生院,以及知名数据科学挑战平台 AIcrowd 联合主办的「IJCAI 2022-Neural MMO 海量 AI 团队生存挑战赛」落幕。在这场比赛中,我们发现了一些进行新探索的可能性。

复杂环境中的多智能体博弈

2019 年,MIT 博士生 Joseph Suarez 在 OpenAI 实习期间开发了 Neural MMO,他借鉴大型多人在线游戏(MMO),模拟出一个庞大的生态系统,系统中包含数量不等的智能体,并让它们在持久、广阔的环境中竞争。行业人士普遍认为,「这个模拟相当有趣」。与过往着眼于技术水准的 AI 游戏对战环境不同,Neural MMO 涉及到了 AI 的长期判断和选择,更考验智能体的决策能力。

「IJCAI 2022-Neural MMO 海量 AI 团队生存挑战赛」使用的正是上述环境。主办方表示,选择 Neural MMO 主要基于两点:一是 Neural MMO 类似于开放世界生存游戏,本身有一个自运转系统,并且定义了采集、攻击、生存等基本机制,二是它支持海量 AI 共存、交互,并涌现策略。无论在学术界还是工业界,这种环境都不多见。

在这场比赛中,每局对战都包含 16 多种不同的平台为交易者提供更多更灵活的选择 支队伍,每支队伍包含 8 个智能体,这些智能体小分队要在 128x128 的地图上进行自由对抗。根据主办方的设计,每个智能体小分队要达成觅食、探索、竞争、打怪四项成就。这意味着每个环境里有 多种不同的平台为交易者提供更多更灵活的选择 128 个智能体同时决策,每支队伍里的 8 个智能体要为了不同的目标进行有效的合作分工。

让海量智能体「卷」起来

对一场学术性质的比赛来说,除了找到好问题,还要有足够多的好选手。为此,主办方从赛事规则、工具、赛事支持等方面对 Neural MMO 挑战赛进行了全面优化。

在工具层面,「IJCAI 2022-Neural MMO 海量 AI 团队生存挑战赛」升级了提交系统,让第一次成功提交到返回结果的时间从原来的两个多小时减少到十分钟;此外,挑战赛还提供了全新的 StarterKit 和 Baseline 。在 StarterKit 中,参赛者只需要跑一遍代码,就可以完成第一个提交;在 Baseline 中,用户只需要训练两天,就可以完成 Stage 1 0.5 的胜率,运行训练四天,就可以获得 Stage 1 0.8 的胜率。

这些设计帮助参赛者在初始阶段迅速地熟悉规则,并以此节省大量时间。利用省下来的时间,参赛者们可以将思考重点放在定义智能体在 Neural MMO 环境中的决策方式上,比如进行奖励信号的设计等。

在赛制上,这场 Neural MMO 挑战赛采取了 PvE 与 PvP 结合的方式。在 PvE 阶段,每个 Stage 的内置 AI 难度会逐渐增加,参赛者由此感受到「梯度」。Stage 1 的难度是最低的,包含了一些基于简单规则编写的开源脚本。之后,Stage 2 的难度会变得更高,主办方基于经典的 PPO 算法对内置 AI 进行训练,并加入自我博弈(Self-Play)的训练机制。到了 Stage 3,智能体的综合能力进一步升级,选手们面对的已经是高度团结的竞争对手队伍。

在 PvE 阶段获,成就分达到 25 的队伍即可晋级;但在 PvP 阶段,难度上升,对战对象从内置 AI 变为其它参赛选手队伍。

让 8 个智能体组团完成任务,是合作博弈中的一个经典问题。如果说在 PvE 阶段的前两个 Stage,依靠单打独斗还能取得一些成绩,那么随着环境内置 AI 不断变强,再到对手从环境内置 AI 变为真实世界中的参赛团队,出战的智能体小分队也需要随之完成脱胎换骨般的进化,以此去理解怎样达成「团队最优决策」。

RL 算法选手,后来者居上

冠军团队 LastOrder 提到,相较现有的其他多智能体环境,MMO 有更丰富的内容,例如生存、战斗、升级、团队 PK、随机地图等。与其他同类比赛不同的是,Neural MMO 挑战赛给参赛者的规则限制很少,这也为强化学习算法的应用提供了广阔的发挥空间。

NeuralNoob 是亚军获得者,他认为 Neural MMO 最明显的特点在于支持的海量智能体,本场比赛的设置为 128 个,但实际上可以增加到上千或者更多。「它是一个多任务的环境,每个智能体需要在必要的时候改变策略各司其职,具有更大的研究价值。」

在比赛过程中,LastOrder 设计了分布式强化学习训练框架 Newton,该框架具备高度灵活性及可扩展性。

NeuralNoob 同样采用强化学习算法,整体方案是 ppo 算法加自我博弈 ( self-play) 训练机制,所有智能体的训练都将 8 个智能体作为一个团队来训练,value 部分则会用到整个团队的共享表征,并按照 CTDE 的方式训练。

在 LastOrder 看来,MMO 这个平台还存在更多想象空间:例如它可以引入更多游戏要素,甚至可以变成一个开放的线上游戏,促进 Human in the loop 等领域的相关研究。对此,NeuralNoob 持相似看法,他认为可以有更多样的装备供智能体选择,并设置一个安全区,智能体到达安全区后不能发动攻击,同时可以和敌方智能体进行装备交易。

在 NeuralNoob 的设想里,甚至可以让智能体临时和敌方智能体进行合作,联手击杀一些强大的内置 AI,而同敌方智能体的合作将会让 MMO 更符合真实世界中合作与竞争共存的关系。

NeuralNoob 认为,这些是强化学习目前比较难胜任的地方,强大如 openai five,也是通过手写规则来实现出装路线,因为设计到装备选择的训练样本占比势必会很小,但依赖链却很长。

智能决策的「今天」和「未来」

更长远地看,Neural MMO 环境提供了一个广阔、高自由度的学术框架,可以推动一些种群层面的行为研究,比如如何高效组队,它甚至能衍生出社会学、经济学方面的概念研究,这些都是现阶段相关领域内瓶颈仍存的研究方向。正因此,「IJCAI 2022-Neural MMO 海量 AI 团队生存挑战赛」 在学术研究层面的意义也更加凸显。

在学界、业界对智能决策的探索过程中,Neural MMO 无疑有希望成为一个很好的试验载体。但现实中的智能决策往往更加复杂,有着更长的决策链条。如何进一步仿真模拟,让 Neural MMO 更大程度上地接近现实决策环境,这需要整个行业进行长期探索。

据了解,超参数科技将依托 2022 NeurlPS 会议举办新一轮 NMMO 挑战赛。相较于「IJCAI 2022-Neural 多种不同的平台为交易者提供更多更灵活的选择 MMO 海量 AI 团队生存挑战赛」,新赛事增加了交易系统,丰富了装备品类、多职业分工以及毒圈机制,这使得它本就开放的环境变得更加贴合现实决策环境。同时,持续丰富的智能体之间合作及竞争的交互方式也大大增加了决策多样性、策略深度以及合作竞争的可能性。