240 投稿
收录了90篇文章 · 3人关注
  • Types of Generalization,Can Memorization Generalize?

    问题1:Memorization can't generalize? 由wide&deep文中定义:Memorization can be lo...

  • 分与合

    大部分的拆分与组合,本质都是在trade off甚至不少明星大佬的离婚与结婚,也是在权衡即时的付出与未来潜在的收益(笑) 模型拆分训练 是否应该...

  • 线性系统在广告产品中的发展

    在各种体系设计与问题建模中,线性系统往往能帮助我们做很多简化,使得很多问题的求解上变得更容易,并且有更好的解析解,更优的bound,更好的收敛理...

  • 关于工业界variance的简单定性数值分析

    Variance估计的难处 再次回顾一下Bengio 对当代DNN的理解:Machine learning is essentially a f...

  • 建模/指标/系统设计

    由于在广告,推荐,营销,甚至很多更特定的业务场景中,整个链路囿于资源局限性,通常在一定工程与算法的限制下,被拆分成了多个模块。一个typical...

  • 预估数值校准分析

    1、充分拟合的模型,分某特征取值维度在训练集上积分(例如区分产品类型进行预估值积分),是否等于训练集上的统计值。 A:不是,需要具体分析。 a、...

  • 模型排序能力与用户相关性

    在推荐场景下,模型auc大于0.5,其排序能力一定高于随机吗?模型离线评估auc大于0.5,上线后发现与随机推荐没差别?排序的商品结果与用户没有...

  • Entropy,Gini ,Information gain

    Entropy 信息量:值域发生概率越小,信息量越大。不确定性越高,信息量越大。 信息熵:值域,更确切为:,为类别数量:Skewed Proba...

  • Necessity of causal inference

    必需做Causal Inference的根源在于:The “fundamental problem of causal inference” (...

  • 策略Infrastructure

    何谓好的 Infrastructure 好的infra意味着:“无论在这些点上用多么山寨雷人的方法去做,只要tech driver的解释能力足够...

专题公告

算法及其理论推导