0
点赞
收藏
分享

微信扫一扫

Qt自动判断文本文件的编码格式(QT自定义文件编辑器)

想溜了的蜗牛 2022-04-14 阅读 89
qt

迅哥说:每个程序员都会遇到乱码问题,只是早晚的事情。(鲁迅:我没说过)
问题形容:比如在qt自定义一个文件编辑器,类似于window的记事本,会发现打开不同编码格式的文本文件会乱码。。
解决方案:window系统的 txt 文件编码一般有 ANSI 或者 UTF8 格式,其中 ANSI 也就是qt里的 GBK格式。因此,只要我们在打开文本文件时先判断该文件的编码格式,然后qt设置好该编码格式后读取文件即可。

void MainWindow::loadFile(const QString &fileName)
{
    QFile file(fileName);
    if (!file.open(QFile::ReadOnly | QFile::Text)) {
        QMessageBox::warning(this, QString::fromUtf8("提示"),
                             QString::fromUtf8("不能读取文件 %1:\n%2.")
                             .arg(fileName)
                             .arg(file.errorString()));
        return;
    }

    QByteArray buff= file.readAll();
    QString codeFormat = GetCorrectUnicode(buff);
    qDebug()<<codeFormat<<__LINE__;
    file.close();
    file.open(QFile::ReadOnly | QFile::Text);
    QTextStream out(&file);

    if(codeFormat == "GBK")
        out.setCodec(QTextCodec::codecForName("GBK"));
    else if(codeFormat == "UTF8")
        out.setCodec(QTextCodec::codecForName("UTF8"));

    textEdit->setPlainText(out.readAll());
}

其中,判断编码格式的函数如下

QString MainWindow::GetCorrectUnicode(const QByteArray &ba)
{
    QTextCodec::ConverterState state;
    QTextCodec *codec = QTextCodec::codecForName("UTF-8");
    QString text = codec->toUnicode( ba.constData(), ba.size(), &state);
    if (state.invalidChars > 0)
    {
        text = QTextCodec::codecForName( "GBK" )->toUnicode(ba);
        return QString("GBK");
    }
    else
    {
        text = ba;
        return QString("UTF8");
    }
}

---------------------------------------------------------------我是一个分割线-----------------------------------------------------------------------------------
网传的Qt自动判断文本文件的编码格式是直接读取并返回文本文件的内容,如下

QString GetCorrectUnicode(const QByteArray &text)
{
    QTextCodec::ConverterState state;
    QTextCodec *codec = QTextCodec::codecForName("UTF-8");
    QString strtext = codec->toUnicode( text.constData(), text.size(), &state);
    if (state.invalidChars > 0)
    {
        strtext = QTextCodec::codecForName( "GBK" )->toUnicode(text);
    }
    else
    {
        strtext = text;
    }

    return strtext;
}
举报

相关推荐

0 条评论