Skip to content

Recommandation System

Startup


Survey


Industry


美团STGCN User-POI-AOI Multi-graph 考虑 Spatial Temporal Q:GCN(图卷积网络)用在大规模图存在性能问题吗?目前实践的图规模有多大? A:目前我们实践中广告上的图会比较多比较大,大概3亿多节点,80多亿条边。性能上,在实际在线用的时候,我们用离线ebedding计算好了,在线做比如索引的召回、点击召回,这样还是比较快的。训练的时候,大多数情况下80多亿边的图在几百G的内存下是可以训练出来的。分布式就更加简单了。如果大家资源不够,那可以图像切割后再进行训练。把图切分,然后每个work上面做自己领域的采样,然后互相训练,最后再做一个整体梯度的回传。

Q:有考虑在POI中加入社交关系吗? A:我们拿到的社交关系数据比较少。目前能构成边的关系还是点击、交易、收藏行为,但是社交在美团场景中还是很少的。所以目前还没有尝试。

Q:针对于用户不同行为设计的多关系图,关系数量是什么样的量级?可否把物品的属性类别也当作关系来做?如果关系数很多,怎么处理? A:第一个问题,这边可能想问的是刚才“时空多图”这个地方吧?首先我们这里的多图并不是指多关系,而是指用户在不同的时间段里面都访问这个POI,每一个时间段一个访问,我们可能会构出一条边来。这边的访问已经结合了我们可能会给不同的交互一个不同的权重,形成同一种关系。比如可能点击行为,给了权重是一,下单可能是三,支付可能是五,这样多关系做一个聚合。 第二个问题,能不能把物品的属性类别当作关系来做。比如像我们这边物品的属性和类别,举个例子,常用的属性是一级类目,二级类目,三级类目,或者是平均价格,这种离散特征的枚举数量是比较少的,不好当关系来做。可能在每种关系做一条不同的边,其实这种你要得到不同的embedding应该也是可以的。

Q:时间信息如何表示? A:基于时间采样,用户在这个时间段上或相邻时间段的交互行为,做一些节点和聚合操作。

Q:针对尾部关注度较低的商家、商品怎么做? A:冷门商品在图里的交互节点会比较少。我们会对图进行裁剪,做稠密平滑处理,从而避免特别热或特别冷的节点。

Q:对于每种行为的学习不同向量最后如何融合? A:多层embedding进行融合,用户在某个时间段只有一个表征。时间片上不会融合。

Q:采样考虑重要性吗? A:会有平滑策略。假设这个时间片下交互少,那么会用其他时间片。不过,距离这个时间间隔越长,采样越少。不会有某个时间片上有太热的点。尾部冷门点我们也会采和它接近的点来进行工作。