如果你花了很长时间去训练一个东西,你一不小心关闭了。那么结果会怎么样?
----会崩溃。
今天看了knnclassfly的git的原码,发现根本没有保存训练数据的任何方法,这就很可怕了,因为如果在没有库的支持下,自己操作这些大维度和大量的数据感觉是非常可怕很有风险的。
如果,你需要保存自己的训练数据,然后在下一次打开的时候直接加载的话,你就必须自主的操作这些训练数据了。经过在网上的一顿折腾,不过很庆幸,借助下列的方法,实先训练数据重新加载:
getClassifierDataset(): {[classId: number]: Tensor2D}
setClassifierDataset(classDatasetMatrices: {[classId: number]: Tensor2D})
虽然在未来的版本中存储训练数据是必然会被添加的,如ML5JS。
不过在开始之前,我建议打印出你的训练数据,(注意shape)这在后面加载数据中很有参考意义。
写一个方法用于保存训练数据:
saveData(){
let dataset=this.knn.getClassifierDataset();
//获取knn所有Example的'训练数据',他们都是矩阵.
var datasetObj={};
Object.keys(dataset).forEach((key)=>{
//枚举出所有key,相当于for ... in..
let data=dataset[key].dataSync();//同步获取tensor的值datasetObj[key]=Array.from(data);
});
let jsonStr=JSON.stringify(datasetObj);
//建议这个把他们转换成str类型去存储,因为他们数据一般有事有点分量的,这样也可以保证在数据传递的时候不会被改变类型,比如路由传值。
//当然对于这些数据操作一般都是写入到文件。
//....do something
// localStorage.setItem("mydb",jsonStr);
}
加载数据:
load(){
let dataset=//你数据源获取方法
let tensorObj=JSON.parse(dataset);
Object.keys(tensorObj).forEach((key)=>{
//1024也不是随便给的 这里就要集合上面输入的key来看了。
console.log(tensorObj[key].length/1024);
tensorObj[key]=tf.tensor(tensorObj[key],[Math.floor(tensorObj[key].length/1024),1024]);
});
//载入
this.knn.setClassifierDataset(tensorObj);
}
好了,现在可以开开心心,快快乐了,高高兴兴,活蹦乱跳的玩耍了.......
(最近感觉做烂了许多东西.....)