task1
task1
colab 资源 挂载google drive运行 更改当前目录 数据EDA 1.查看句子长度 2.样本均衡情况 baseline 提升策略 修改loss 使用 dtp Dy...
召回 item2vec[http://ceur-ws.org/Vol-1688/paper-13.pdf](single item recommendations ,user...
参考教程https://github.com/xcqu2009/WeatherOceanForecasts/[https://github.com/xcqu2009/Weat...
教程:https://tianchi.aliyun.com/forum/postDetail?postId=145917[https://tianchi.aliyun.com...
1.统计词频:写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率。 为了简单起见,你可以假设: words.txt只包括小写字母和 ' ' 。...
1.gxdc 20201221~20201225.csv 是共享单车轨迹数据2.gxdc_dd.csv 共享单车订单数据3.gxdc_tcd.csv 共享单车停车点位(电子围...
赛题任务: 以预测用户未来点击新闻文章为任务,该数据来自某新闻APP平台的用户交互数据,包括30w用户,近300w次点击,共36w多篇不同的新闻文章,同时每篇新闻文章对应的e...
1.arcgis api for python 自制点 featurelayer 最近在做时序空间数据建模和可视化,尝试一下arcgis。挖坑~~argis api for ...
1.协同过滤协同过滤(collaborative Filtering)是rs中最经典,最常用的方法CF, 基本思想是根据用户之前的喜好以及其他兴趣相似的用户的选择来给用户推荐...
dp可以解决的问题 (1)最值(2)方案数 (3)可行性dp的方向性 :坐标型动态规划,前缀型动态规划dp[坐标] = 行走到这个坐标的最优值dp[i] max{= dp[...
1. 刷leetcode, labuladong 算法小抄 https://github.com/labuladong/fucking-algorithm 2. 刷 SQL ...
学习主题:作者关联(数据建模任务),对论文作者关系进行建模,统计最常出现的作者关系;学习内容:构建作者关系图,挖掘作者关系学习成果:论文作者知识图谱、图关系挖掘 networ...
学习主题:论文分类(数据建模任务),利用已有数据建模,对新论文进行类别分类;学习内容:使用论文标题完成类别分类;学习成果:学会文本分类的基本方法、TF-IDF等; 文本分类:...
任务主题:论文代码统计,统计所有论文出现代码的相关统计;任务内容:使用正则表达式统计代码连接、页数和图表数据;任务成果:学习正则表达式统计; 数据处理步骤 在原始arxiv数...
Challenges and Opportunities abstract—— Geosciences 是一个于社会息息相关的领域,需要解决人类和地球面临的若干紧急问题,随着...
任务说明 任务主题:论文数量统计,即统计2019年全年计算机各个方向论文数量;数据集:https://www.kaggle.com/Cornell-University/ar...
1. 信息增益,增益率 输入:训练集{} ; 属性集{} 过程:函数 信息熵 是度量样本集合纯度最常用的一种指标, 假定当前样本集合D中第k类样本所占的比例为 ,则的信息熵定...