启动BIEE的服务时可以正常启动,em和Console都可以正常登录,但是analytics不能登录,检查em发现组件有问题,查看Log,发现报错如下: 之前没有修改过这个用...
启动BIEE的服务时可以正常启动,em和Console都可以正常登录,但是analytics不能登录,检查em发现组件有问题,查看Log,发现报错如下: 之前没有修改过这个用...
故障现象 BIEE维护人员通知跑DAC任务时发现调度计划报错。按照以往维护的惯例,应该是表空间不足,可能存在了性能问题,因此通过Informatica的Workflow Lo...
在输出一些编号类型的数字时,往往需要前面补0,比如这样的数字: 要把这些1234什么的都加一个0,可以直接用apply,里面用format就好,但是format的格式的确是有...
一般的商业数据库(其实也就是DB2,Oracle,SQL Server)都具备窗口函数这个功能,只不过名称不同,我比较熟悉的Oracle叫做分析函数,DB2好像叫做OLAP函...
K-Means属于聚类算法,是一种无监督学习算法,没有训练集和测试集之分,也没有正确分类的标签与之参照来提升学习效果。 聚类就是把一堆样本根据一些特性分成不同的簇,也就是类。...
在爬取网页的过程中,经常会遇到一些弹窗的情况,有alert、confirm、prompt等三种,区别如下: alert() 弹出个提示框 (确定)警告消息框 alert 方法...
关联分析,顾名思义就是找出哪几项之间是有关联关系的,举个例子: TID购物记录1面包、牛奶2面包、尿布、啤酒、鸡蛋3牛奶、尿布、啤酒、可乐4面包、牛奶、尿布、啤酒5面包、牛奶...
支持向量机(support vector machine,SVM)是一种出色的分类技术,也可以用于回归分析(SVR)。这种技术可以很好的应用于高维数据,避免维度灾难等问题。 ...
随机森林(RandomForest)是一类专门为决策树分类器设计的组合方法,关于组合方法可以参考https://www.jianshu.com/p/9e4db2759866中...
决策树算法是一种比较简易的监督学习分类算法,既然叫做决策树,那么首先他是一个树形结构,简单写一下树形结构(数据结构的时候学过不少了)。 树 树状结构是一个或多个节点的有限集合...
这个算法的原名叫什么相信大家都清楚,不知道标题为什么变成了敏感词。 组合方法(集成方法) 两种不同的翻译,这种方法是聚集多个分类算法的预测来提高分类的准确率,组合方法由训练数...
KNN 意思就是K个最近的邻居,是一种监督学习下的分类算法,注意不要和K-Means(聚类算法)混淆。 积极学习方法和消极学习方法 按照由训练数据-建立模型-用模型对测试集进...
用途 朴素贝叶斯算法,主要用于对相互独立的属性的类变量的分类预测。(各个属性/特征之间完全没有关系,叫做相互独立,事实上这很难存在,但是这个方法依然比较有效。) 贝叶斯定理 ...
concat()可以把字符串合并到一起,在对于需要判断两个不同条件的时候,比较有用,把两个条件进行合并,很简便,函数的参数和格式为: concat(str1, str2,.....
分组函数groupby 在处理数据的时候经常会用到分组,类似于SQL中的group by,按照group by后面接的字段来分成组,之后再进行其他处理。 Pandas中内置了...
众所周知Mysql8.0之前是不支持窗口函数的,所以在用到老版本MySQL的时候,如果遇到想分组排序排名之类的需求,可以采用如下方式进行: 设有表employee,数据如下(...
1 查看pandas的版本 解决办法 结果如下 2 如何通过list,numpy array, dict创建series 现有list, numpy array, dict如...
二元分类评价 混淆矩阵 对于二元分类,通常可以输出混淆矩阵,看预测的情况,并从中总结出一些指标,给予评价。混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用n行n列的矩阵...
51JOB的数据相比BOSS直聘还是好做很多,首先还是在items.py中进行定义: 然后也是采取直接搜索全国-数据分析职位的url作为起始url,记得需要模拟一个请求头: ...
最近学习数据分析,因此尝试一下这两个网站的职位需求做分析用,在其中遇到了很多坑,记录一下。 框架就选用了scrapy,比较简单,建了两个文件,分别作用于不同的网站。 先来看B...