ML09 | 欠拟合&过拟合
Javascript玩转机器学习09
欠拟合
- 数据过于复杂,但是神经网络模型过于简单
- 无论训练多久,训练损失始终降不下去
过拟合
- 模型过于复杂,把训练集噪声数据都拟合进去
- 过拟合损失曲线,红色代表验证集,蓝色代表训练集
实操模拟 欠拟合&过拟合
- 加载带有噪音的二分类数据集(训练集与验证集)
- 使用不同神经网络演示 过拟合&欠拟合
- 过拟合应对法:早停法、权重衰减、丢弃法
加载带有噪音的二分类数据集(训练集与验证集)
脚本原理
生成正态分布(高斯分布)的样本数据
function normalRandom(mean = 0, variance = 1) {
let v1, v2, s;
do {
v1 = 2 * Math.random() - 1;
v2 = 2 * Math.random() - 1;
s = v1 * v1 + v2 * v2;
} while (s > 1);
let result = Math.sqrt((-2 * Math.log(s)) / s) * v1;
return mean + Math.sqrt(variance) * result;
}
正态分布两边低的数据看作噪音数据,中间高的数据视为正常数据
通过调整方差 调整噪音量
用脚本生成带有噪音的二分类数据集
import * as tf from "@tensorflow/tfjs";
import * as tfvis from "@tensorflow/tfjs-vis";
import { getData } from "./data";
window.onload = async () => {
const data = getData(200, 3);
};
可视化数据集
tfvis.render.scatterplot(
{ name: "训练数据" },
{
values: [
data.filter((p) => p.label === 1),
data.filter((p) => p.label === 0),
],
},
);
使用不同神经网络演示 过拟合
const data = getData(200, 2);
tfvis.render.scatterplot(
{ name: "训练数据" },
{
values: [
data.filter((p) => p.label === 1),
data.filter((p) => p.label === 0),
],
},
);
const model = tf.sequential();
//第一层隐藏层
model.add(
tf.layers.dense({
units: 10,
inputShape: [2], //长度为2的一维数组
activation: "tanh",
}),
);
//输出层
model.add(
tf.layers.dense({
units: 1,
activation: "sigmoid",
}),
);
//设置损失函数&优化器
model.compile({
loss: tf.losses.logLoss,
optimizer: tf.train.adam(0.1),
});
const inputs = tf.tensor(data.map((p) => [p.x, p.y]));
const labels = tf.tensor(data.map((p) => p.label));
await model.fit(inputs, labels, {
validationSplit: 0.2,
epochs: 200,
callbacks: tfvis.show.fitCallbacks(
{ name: "训练效果" },
["loss", "val_loss"],
{ callbacks: ["onEpochEnd"] },
),
});
过拟合应对法:早停法
在训练出现过拟合时及时手动停止训练
过拟合应对法:权重衰减法(设置L2正则化
将过于复杂的模型权重降低
model.add(
tf.layers.dense({
units: 10,
inputShape: [2], //长度为2的一维数组
activation: "tanh",
kernelRegularizer: tf.regularizers.l2({ l2: 1 }), //设置权重衰减
}),
);
过拟合应对法:丢弃法
在隐藏层和输出层之间添加一个丢弃层
//添加丢弃层,降低训练集复杂度
model.add(tf.layers.dropout({ rate: 0.9 }));
上次更新: