首次揭秘 | 淘宝新发布的躺平如何做3D场景化导购?

如题所述

赵斌强(乐田)——阿里巴巴资深算法专家,现任淘系技术部算法负责人,在内容推荐、商品导购、机器学习等方向有很多深入的工作。在「中国计算机大会2019」的演讲中,他主要介绍 3D 和机器学习的结合,打造新的场景化导购的商业场景应用。

场景化导购,2012 年开始出现,主要以单品形式做个性化推荐。随后在内容导购方面尝试新的突破,主要以图文、短视频、直播作为导购的载体。随着 3D 技术日渐成熟,3D 自动理解、自动创作和渲染技术可以进一步把物理世界和虚拟世界结合起来,形成新的用户场景。我们开发了一个新的导购产品——躺平,大家可以在淘宝的搜索框搜索「躺平」,来体验 3D 场景化导购的初步效果。

3D 场景化导购值得关注,因为它能更接近数字世界通常的做法,文字是一维的,图片是二维的,视频增加了时间维。而 3D 是三维的,和我们生活的物理世界更加一致。通过 3D 技术把产品形态升级一个维度,极有可能发展新的商业机会。例如,用户对一个桌子感兴趣,当看到桌上摆放的茶壶等物品,就把用户带入了一个场景中。或许用户也对这些东西感兴趣,对需求不再是单点的激发方式,而是通过网状、多角度的激发方式,激发出用户更多的需求,这就是导购的价值。

在导购中,3D 能解决什么问题?首先能想到的是尺寸大小和视觉问题。用户总会关心商品的尺寸问题和视觉问题。从尺寸和视觉来看,用户对 3D 肯定是有需求的。用户购买服装需要尺寸和视觉体验,即使是标准化的东西冰箱、洗衣机也都需要 3D 来感知商品。

买什么商品对尺寸有要求?比如我们去买家具可能需要到线下,会去家装商城看颜色、风格、尺寸是否匹配,有味没味道。现在这些在 3D 里通过虚拟化技术都可以实现,所见即所得。也可以和 AR 结合,形成更流畅的用户体验。

从可实现性来说,模拟一个人穿上衣服的感觉是有很大的难度的,电影大制作那种做视频动画,用设计师去画,成本非常高,不可能用这样的成本去支持 3D 导购项目。我们选择的场景一定是在内容制作方面技术更为成熟的,在落地上是比较可控的,家装行业是一个不错的选择。

导购最重要的是两个部分,一个性化,二是内容的生产。以抖音为例,它核心的创新之一就是可以让用户以简单的操作去生成高品质的内容。对我们来说,通过机器自动生成海量导购内容,然后用个性化推荐技术形成精准的需求匹配。

为了生成场景,首先要有一套搭配算法。我们通过算法搭配,结合设计师的知识图谱,把两个东西结合起来,形成高品质的搭配结果。设计师的专业输入怎样在算法中流畅丰富地表达?是其中一个很值得研究的问题。通过搭配专家的支持,结合机器学到的模型,我们就可以在一个大的3D商品模型池中生成内容。用搭配的结果在3D场景背景中布局,布局之后渲染,再把商品的锚点打到上面,用户就可以通过点击这些锚点去购物。生成的3D场景化内容,可以在推荐流或搜索场景中为用户透出。

在以上数据的基础上,综合使用可解释性的逻辑和和深度学习技术构建算法。可解释性中很关键的是提取语义标签,包括品类、风格,颜色等。此外在视觉方面提取隐式特征向量,最后用深度学习建模,将形成整个算法方案。风格非常重要,大家平时看到的很多现代、简约风,但在整个家居市场中有很多风格,风格彼此之间是不能乱搭配的。为了精准地提取风格,需要有一套方法,从零到一,没人告诉我们家居是什么风格的,要把这个体系建起来。用数据结合算法、人工输入,逐渐丰富标签体系。甚至必要的情况下还会扩充一些细化的标签,这里会有人和机器结合的循环过程。

有了这个风格之后,最后生成搭配。这是一个类似于推荐技术的过程,先粗选再细选。搭配是一个迭代的过程,逐步评估候选模型中的商品,并将合适的候选商品选入已选商品集合中。涉及到视觉方面,深度学习是标配。通过一个轻量级的网络提取出相应的视觉特征,针对当前商品提取 attention 特征,形成精准的搭配质量评分模型。

整体上看,搭配是比较困难的,不仅要相似,还要有一定的区别。什么和什么搭,这里面既要有相似,又要有互补的关系,而互补关系需要引入新的信息视角。有了搭配结果后,进入到下一个步骤——布局。在布局之前要有一个空间把这个东西布上,这个空间需要体现场景的美感和品味。根据这些搭配的结果,我们去算出这些配件的空间关系,这个关系要有弹性,不能硬碰硬。通过一个概率图组合搭配的逻辑,生成一个关系的概率。算法提供了给卧室、用餐区、厨房等场景的布局能力。

布局的关键是舒适度,看到布局结构会不会让人感觉到舒服,要做舒适度分析。舒适度分析需要机器学习技术,我们甚至还引入了 GPU 去优化它的舒适度分析的结果。在 3D 转换到 2D 图片方面,我们在构图的时候要选择取景的视角。有正对的视角、侧对的视角,总有更适合场景的视角。再加上一些规则防止选的空间过于深、空旷或拥挤,在视觉上看上去比较舒适,都和我们后面的效果评估有很大关系。

建立在海量内容基础上的导购,最终决定一个内容质量的还是用户的行为反馈。生成一个内容,内容经过投放以后,会产生点击率,通过点击率判断用户感不感兴趣。在投放一段时间后,知道不同内容的点击率是什么,通过模型可以知道这个内容好不好。比如一个新的内容出来后,如果点击率比较低用户不接受就需要淘汰这个内容,点击率比较高则会选入到库里。

我们生成内容的丰富度还是很高的,办公桌、饭厅、卧室、会议室、吧台,这些东西都可以生成。3D 和机器学习结合,涉及到 3D 场景生成、 3D 搭配推荐、机器学习、深度学习等模块,关键在于 3D 建模和搭配推荐。目前3D 搜索、AR、VR、MR 还有想象空间,为工业界提供了解决问题的广阔场景。
温馨提示:答案为网友推荐,仅供参考
相似回答
大家正在搜