我正在用scikit学习研究高斯过程回归问题。为了进行预测,我有这样的数据集,它包含传感器在三维坐标系中的10个不同位置:例如Sensor1 coords:
[[ 30.1678 -173.569 725.724 ]
[ 29.9895 -173.34 725.76 ]
[ 29.9411 -173.111 725.768 ]
[ 29.9306 -173.016 725.98 ]
[ 29.6754 -172.621 725.795 ]
[ 29.5277 -172.274 725.903 ]
[ 29.585 -171.978 726.111 ]
[ 29.4114 -171.507 726.188 ]
[ 29.3951 -170.947 726.173 ]
[ 29.3577 -170.196 726.384 ]]
我执行的探地雷达与离开一技术,以便在每次运行我使用9个三维坐标。训练我的模型并在一个坐标上测试。然后我改变排列继续。在
为了防止过拟合问题,我想用数据扩充来放大(或添加noiese)我的训练数据。我见过的大多数数据增强技术都不适合用于图像(随机旋转、裁剪、翻转等)。我的问题是:在python中有什么方法可以对我的数据进行处理吗?在
扩大我的以上数据有什么限制吗。我可以为一个特定的三维坐标添加多少噪音。?在
要添加的新噪声数据,例如列x的值应介于min(29.585)和max(30.1678)之间。我说的对吗?或者也可以排成一排吗?在
谢谢你!在
编辑
所以,我手动产生了噪音。在
^{pr2}$
我现在的问题是:如果我通过random.uniform(low, high, size)在最小值/最大值之间生成浮动,那么噪声数据的标准偏差有时会大于0.8 or 1.0。因此,探地雷达预测的均方根误差较大。如何设置一个限制,使生成的float的SD不能大于0.2?在