提供丰富的素材资源、软件工具、源码模板、技术文章和编程教程，专注于网站搭建、AI应用、开源项目分享和工具推荐。帮助开发者轻松获取所需资源，快速提升技术水平。

搜索后端开发相关内容

热词：

youtube会员

YouTuBe

disney会员

Disney

Netflix奈飞账号

Netflix

iCloud+

iCloud+

hbo+max

HBOMax

GPT+API

GPTPro

Spotify会员

Spotify

合租&账号

艾维正版

莱卡云服务器

bandwagonhost云主机

雨云服务器

TensorFlow MNIST手写数字分类：训练集准确率极低，问题出在哪儿？

2025-03-10 11:26

24

标签导航：

tensorflow mnist手写数字分类：训练集准确率极低，问题出在哪儿？

TensorFlow MNIST手写数字分类：低训练集准确率的根本原因及修复方案

在使用TensorFlow进行MNIST手写数字分类时，许多开发者会遇到一个难题：即使对训练集和测试集进行了像素归一化，训练集的准确率仍然异常低。本文将深入分析此问题，并结合代码示例提供有效的解决方案。

问题根源在于原始代码中y_pred的计算方式。代码中y_pred = tf.nn.softmax(tf.matmul(X, W) + B)这一行，错误地将softmax函数应用于未经softmax处理的预测结果。tf.nn.softmax_cross_entropy_with_logits函数期望输入的是未经softmax处理的预测值（logits）。原始代码却将softmax后的结果传入该函数，导致交叉熵损失函数计算错误，最终影响模型训练效果，导致训练集准确率极低。

为了解决这个问题，我们需要调整y_pred的计算方式以及准确率的计算方式。正确的做法是在损失函数计算后应用softmax函数获取最终的预测概率，而损失函数计算则使用未经softmax处理的预测值。

修正后的代码如下：

# 导入必要的库
import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow.examples.tutorials.mnist import input_data
import os
import pickle

# 超参数设置
numClasses = 10
inputSize = 784
batch_size = 64
learning_rate = 0.05

# 下载数据集
mnist = input_data.read_data_sets('original_data/', one_hot=True)

train_img = mnist.train.images
train_label = mnist.train.labels
test_img = mnist.test.images
test_label = mnist.test.labels
train_img /= 255.0
test_img /= 255.0


X = tf.compat.v1.placeholder(tf.float32, shape=[None, inputSize])
y = tf.compat.v1.placeholder(tf.float32, shape=[None, numClasses])
W = tf.Variable(tf.random_normal([inputSize, numClasses], stddev=0.1))
B = tf.Variable(tf.constant(0.1), [numClasses])
y_pred = tf.matmul(X, W) + B  # 修正：移除softmax

loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y, logits=y_pred)) + 0.01 * tf.nn.l2_loss(W)
opt = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)

correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(tf.nn.softmax(y_pred), 1))  # 修正：在计算准确率时应用softmax
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

saver = tf.train.Saver()
multiclass_parameters = {}

# 运行
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())

    # 开始训练
    for epoch in range(20):
        total_batch = int(len(train_img) / batch_size)

        for batch in range(total_batch):
            batch_input = train_img[batch * batch_size: (batch + 1) * batch_size]
            batch_label = train_label[batch * batch_size: (batch + 1) * batch_size]

            _, trainingLoss = sess.run([opt, loss], feed_dict={X: batch_input, y: batch_label})

        train_acc = sess.run(accuracy, feed_dict={X: train_img, y: train_label})
        print("Epoch %d Training Accuracy %g" % (epoch + 1, train_acc))

通过以上修正，tf.nn.softmax_cross_entropy_with_logits函数能够正确计算损失，模型得以有效训练，最终显著提升训练集准确率。请注意，在计算最终预测概率时，仍然需要使用tf.nn.softmax函数。

相关文章推荐

Go语言time.Now().Format("2006.0...

Java缓存数据读取失败：静态变量与单例模式的陷阱及解决方案？

Python如何将PDF表格转换成Word表格并保持原有样式？

MySQL UUID主键重复了，是怎么回事？

Nameko框架下，Logger的handlers为空时，...

Java如何实现Excel表格中间插入列？

Flask项目运行一段时间后主页无法访问，IP地址异常变更...

Python多进程Pipe报错“管道已关闭”：如何优雅地处...

macOS下Python虚拟环境安装成功却无法使用怎么办？

Java调用C++ COM DLL：通过C#封装是否可行及...

Android RecyclerView数据更新失败：异步...

FastAPI空字符串查询参数如何优雅地转换为None？