提供丰富的素材资源、软件工具、源码模板、技术文章和编程教程，专注于网站搭建、AI应用、开源项目分享和工具推荐。帮助开发者轻松获取所需资源，快速提升技术水平。

搜索后端开发相关内容

热词：

MNIST手写数字分类：像素归一化后训练精度低，是哪个步骤出了问题？

2025-03-12 08:34

标签导航：

mnist手写数字分类：像素归一化后训练精度低，是哪个步骤出了问题？

MNIST手写数字分类：像素归一化后精度骤降的原因及修复

在使用TensorFlow进行MNIST手写数字分类时，许多开发者遇到一个难题：对图像进行像素归一化处理后，模型训练精度异常低下。本文将深入分析此问题，并提供有效的解决方案。

问题描述：

一个简单的TensorFlow线性模型用于MNIST数据集分类。对图像像素进行归一化（除以255.0）后，训练精度极低，接近随机猜测。

代码片段（问题代码）：

# ... (导入包和超参数设置) ...

# ... (下载数据集并归一化) ...
train_img /= 255.0
test_img /= 255.0

# ... (定义占位符和变量) ...

y_pred = tf.nn.softmax(tf.matmul(x, w) + b) # 问题所在

# ... (定义损失函数、优化器和准确率) ...

# ... (训练过程) ...

问题根源分析：

核心问题在于 y_pred = tf.nn.softmax(tf.matmul(x, w) + b) 这一行。tf.nn.softmax 计算softmax概率，期望输入的是logits（未归一化的分数），而非已归一化的概率。原代码在计算y_pred时提前应用了softmax，导致tf.nn.softmax_cross_entropy_with_logits 函数输入不符合预期，从而导致梯度下降失效，精度极低。

解决方案：

将softmax函数的应用延迟到计算准确率阶段。修改后的代码如下：

# ... (导入包和超参数设置，数据集加载及归一化) ...

# ... (定义占位符和变量) ...

y_pred = tf.matmul(x, w) + b # 去除softmax

# ... (定义损失函数，优化器) ...

correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(tf.nn.softmax(y_pred), 1)) # 在此处应用softmax
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

# ... (训练过程) ...

通过移除y_pred计算中的tf.nn.softmax，确保tf.nn.softmax_cross_entropy_with_logits 函数接收的是logits，从而正确计算损失函数并进行梯度下降。在计算准确率时再应用softmax，将logits转换为概率。这修复了由于不正确的softmax应用导致的梯度计算错误。

通过以上修改，模型应该能够在像素归一化后正常训练，并达到预期的精度。记住，tf.nn.softmax_cross_entropy_with_logits 期望输入logits，而不是softmax概率。

提供丰富的素材资源、软件工具、源码模板、技术文章和编程教程，专注于网站搭建、AI应用、开源项目分享和工具推荐。帮助开发者轻松获取所需资源，快速提升技术水平。

搜索后端开发相关内容

MNIST手写数字分类：像素归一化后训练精度低，是哪个步骤出了问题？

相关文章推荐

Go语言time.Now().Format("2006.0...

Java缓存数据读取失败：静态变量与单例模式的陷阱及解决方案？

Python如何将PDF表格转换成Word表格并保持原有样式？

MySQL UUID主键重复了，是怎么回事？

Nameko框架下，Logger的handlers为空时，...

Java如何实现Excel表格中间插入列？

Flask项目运行一段时间后主页无法访问，IP地址异常变更...

Python多进程Pipe报错“管道已关闭”：如何优雅地处...

macOS下Python虚拟环境安装成功却无法使用怎么办？

Java调用C++ COM DLL：通过C#封装是否可行及...

Android RecyclerView数据更新失败：异步...

FastAPI空字符串查询参数如何优雅地转换为None？