嗨，各位大佬好，不知过年有没有想起我，沉寂了一个多月该出来溜溜了。在推荐场景中，无论是召回，排序或者粗排阶段都需要训练数据，用户的点击行为历史是一直在更新的，这就必然要求模型一直训练，因而增量训练成为必然。如果没有增量训练，那么推荐就会限于局部，比如很多item不够充分曝光、很多user短期内行为只有很少难以推荐相应的item、user和item不能够相互匹配（match）。当引入增量训练，很多问题就会不解而解，等于是绕过了很多问题，这时候的推荐则是全量的数据，全部的user和item，只要有行为，不管user在任何时候点击了，不管item有几个人点击，都可以得到相应的匹配，这是对内容的充分利用，让用户最大EE（给用户很多可能感兴趣的其他偏好），这是非常nice的。

下面则是简单的函数调用，

1-初始化方法。这个说起来有很多方法，常见的正态分布（或者截断正态分布、固定均值和方差的）以及Xavier，he等方法都可尝试。

初始化的时候要注意，一定要有初始化，，，这不是废话。

sess.run(tf.global_variables_initializer())

常用的函数如下，其他不多赘述。这两个意思一样，亲测结果一样，但前者只能加载一维的变量，如果采用初始化器则可以。

tf.get_variable()
tf.Variable()

2-累计编码。对见过的user/item进行编码，未见过的从上次的最大编码值处开始编码。

直接采用dict及zip即可解决，去重的话采用set的difference。但是奇怪的是在gbdt的编码中有误，百度的大佬说gbdt不能增量训练，也不知道是不是真的。待验证。

问题思考：

3-在一段时间内，如果user没有行为，那么训练中该user的emb是否会更新，讲道理应该没有更新，如果没有更新，如何给它推新的item呢？这时user的emb与item的新的emb并不算服从同一个模型啊，这样给它推item是否合理？？

同样，如果真的在全部的user和item空间进行推荐，那么有些item的emb某一次没有经过训练，而有的item则经过训练了，这样这两个item的空间距离是怎样变化的？一个普适性的理论是：如果两个item距离很近，那么它们在任何空间的距离都很近。如果经训练的item与未经训练的item的距离变化了（本来应该近的，训练后距离远了，或者本来距离远的，训练后距离近了，注，这里的训练是指一个训练，一个未训练）这种情况怎么应对呢？可能最后推出的item并不理想，当然，如果更新的频率较快，比如1h，是不是可以忽略这种变化的影响？

4-上述3的假设是：如果近1h的数据中没有某个user或item，那么训练后他们的emb肯定没有变化，这个是不是真理？？

请教了同事大佬，他觉得如果是数据可以在短时间进行更新，不必增量训练，另外，如果相似的item或者user经训练后变化大也可能是他们本来就不是那么相似，这是变化的思想，似乎也有道理。大佬还觉得，如果需要增量训练，如果要避免OOM问题，那么可以将没有用到的user和item向量去掉（也就是说未经训练的user/item的向量不变），这就是说要另外建立一个索引，每次都要重建，这个很心累的，如果我不想建立索引，只能减少batch_size，我怕最后的batch_size等于1还好OOM，这样即使采用多GPU也难以解决问题，而重建索引真的很麻烦。进退两难啊。所以今天的周报咋写呢？？？

后记，最近请教了很多公司的同事，有些公司的算法和工程是分开的，做算法的就是一直优化迭代更新模型，提升效果，这才是真的做算法，而有专门做工程的。如果是这样，那么精力只能花在几个模型上进行更新，而不是今天复现个paper，明天copy个代码，跑一下，能用，然后就over了，这仍旧没有丝毫的竞争力。

张士玉小黑屋

当前位置：首页 » 《关于电脑》 » 正文

关于增量训练中的参数初始化_Video Recommendation

27 人参与 2021年03月12日 13:03 分类 : 《关于电脑》评论

愿我们终有重逢之时，而你还记得我们曾经讨论的话题。

评论（0）

赞助本站

search zhannei

最新文章