哈希游戏平台马斯克说到做到:开源X平台核心推荐算法
哈希游戏作为一种新兴的区块链应用,它巧妙地结合了加密技术与娱乐,为玩家提供了全新的体验。万达哈希平台凭借其独特的彩票玩法和创新的哈希算法,公平公正-方便快捷!万达哈希,哈希游戏平台,哈希娱乐,哈希游戏
,用户塔输入是【用户特征,S长度的行为序列】,内容塔是帖子标识与帖子作者。用户塔是双层的的Decoder-Only的Transformer,Output取所有位置的平均池化,进行L2归一化;内容塔是两层MLP;采用dot product检索。
●X开源的是内容推荐(Feed on X)的召回、精排的在线请求视角的推理、策略/过滤代码,未开源训练(含Loss设计、样本组织的代码)。
● 模型参数配置较小(例如用户行为序列是32),应是实际部署代码的简化Demo版本。推测开源核心目的是为了体现X的透明性,解除广告主与X的用户对X的Feed推荐策略受到非内容因素干扰的担忧。
○输入:用户塔是【用户特征,用户行为序列S长度】,内容塔是帖子标识+帖子作者
● 只开源了推理视角的模型(召回、精排)、策略/过滤代码,没有开源训练的代码(Loss、样本等)。
● Candidate Hydration,为每个候选补充数据【文档里描述,代码里没有使用这些信息】
○去除重复的、老帖子、自己的帖子、屏蔽的作者的帖子、屏蔽的关键词的帖子、过去看过的帖子、不是订阅状态不可见的帖子。
○weighted scorer,多目标分数融合,得到一个最终分数【权重参数未开源】
●双塔模型,应用于从非用户关注的账户里检索潜在感兴趣的帖子,百万级别候选,返回千级别候选
○多个哈希查询的embedding进行拼接,再用可学习的权重矩阵Projection投影到D维
○产品界面ID,表达来自哪个界面。通过one-hot单热编码方式查表得到。
○先concatenate,序列上每个位置,再用可学习的权重矩阵Projection投影到D维
○候选帖子唯一标识,通过多个哈希函数映射,num_item_hashes
○候选帖子作者标识,通过多个哈希函数映射, num_author_hashes
○在Retrieval基础上,多了一个上下文特征,候选帖子将在哪个产品界面展示给用户。
■抽取用户的history之后的候选位置的输出,该位置表达每个候选的Output。