总结这几天的教训——“好记性不如烂笔头”,像我这种记忆力堪比金鱼的脑子,相当适用。
最近就是遇到问题现去百度,解决了也就丢了,导致遇到一次去百度一次,解决一次忘一次,总之留了个印象,具体代码怎么写,老记不住,毕竟一会儿有时候在eclipse上写代码,一会儿为了方便分析处理数据又在Jupyter notebook上写,文件命名也随性,反正乱七八糟,效率极低,所以有了开头。
记下遇到的问题和解决方案,方便自己回顾(降低检索成本),利己利人。
时间紧,任务中,先粗略写一丢丢,有时间了再细细整理。
一、有关pandas
1、分组聚合:http://www.cnblogs.com/zephyr-1/p/5874678.html
2、去重函数:http://blog.csdn.net/xinxing__8185/article/details/48022401
3、缺失值定位:http://blog.csdn.net/u012387178/article/details/52571725
二、有关Python计量包stats models
statsmodels模块简介:http://jingyan.baidu.com/article/3d69c5518fd2e2f0cf02d73a.html
import numpy as np
import statsmodels.api as sm
[1]Linear Regression Model
lrm_data =sm.datasets.spector.load()
lrm_data.exog=sm.add_constant(lrm_data.exog,prepend=False)
lrm_model = sm.OLS(lrm_data.endog,lrm_data.exog)
res = lrm_model.fit()
print(res.summary())
[2]Generalized Linear Model:主要用于各种设计的方差分析
data = sm.datasets.scotland.load()
data.exog = sm.add_constant(data.exog)
gamma_model = sm.GLM(data.endog,data.exog,family=sm.families.Gamma())
results = gamma_model.fit()
[3]Robust Linear model
data = sm.datasets.stackloss.load()
data.exog = sm.add_constant(data.exog)
rlm = sm.RLM(data.endog,data.exog,M=sm.robust.norms.HuberT())
res =rlm.fit()
print(res.params)
[4]Discrete Chioce Model:离散选择模型,Logit模型属于离散选择模型,主要用于微观计量经济学范畴
data = sm.datasets.spector.load()
data.exog = sm.add_constant(data.exog)
logit = sm.Logit(data.endog,data.exog)
res = logit.fit()
print(res.summary())