百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

为什么不建议在 MySQL 中使用 utf8 ?

nanshan 2025-04-30 18:33 17 浏览 0 评论

最近,小编在知乎上看到这样一个问题:




为什么不建议在MySQL中使用utf8 ?




秉持着和平交流的学习态度,小编精选了几位高赞知乎网友的精彩回答,分享给大家学习交流(勿上升、勿引战):





1号知乎网友:灵狐技术



MySQL当年在支持utf8的时候,自作聪明整了些优化措施。结果,大家使用过一段时间后,发现了这些优化措施,不能完整地支持utf8。


MySQL后面想修正这个bug。但是,这个优化版utf8已经在外面大量使用了。所以,MySQL只好保留了bug版的优化utf8,然后整了个utf8mb4来重新支持utf8标准。


MySQL的这个教训说明:

  • 对于标准化的东西,别瞎捉摸;
  • 你的理解再怎么自认为有道理,没用!只会闯祸!你做的题,只要对不上公开的标准答案,就是零分……





张鹏华:这个吃过大亏,现在很多订单里面会有表情符号,如果直接保存订单内容会直接从表情符号后截断,没有后面的内容

风之帆:因为MySQL的utf8是阉割版的utf8,utf8mb4才是真正的utf8。

邵NewBee:被坑过一次,项目开发上线了发现不支持表情回复。

精灵福将马国成:我们公司最开始一个项目,当时MySQL数据库设置utf8,项目使用了半年,然后录入了广东那边一个人身份证名称带有生僻字,导致入库报错,后来我们把utf8改成utf8mb4就好了。




2号知乎网友:写代码和简谈人文



MySQL的utf8只支持每个字符最多三个字节,而我们需要的是最多四个字节,从而我们在操作字符串时,会遇到一些很难溯源的bug(比如表情存储)。


MySQL在2010发布了utf8mb4来支持四个字节,可以说MySQL的utf8mb4是我们真正意义上的UTF-8。


MySQL本意是想在utf8上保持空间和速度,但是在使用utf8的char列时,实际使用的空间比预期更大,速度也慢,而且无法保存“”这样的字符,MySQL发布了utf8mb4来绕过了这个问题。




3号知乎网友:CoderJia



在MySQL 8.0中,推荐使用的编码是utf8mb4。这种编码方式完全兼容utf8,每个字符最多占4个字节,就可以支持更多的字符,原来的utf8编码只能存储最多三个字节的字符,这在存储某些国家的文字或罕见字时有些困难了。


从MySQL 8.0版本开始,其默认的连接字符集从latin1改为了utf8mb4,同时字符序也从latin1_swedish_ci改为了utf8mb4_0900_ai_ci。当使用utf8mb4字符集时,通常推荐使用utf8mb4_unicode_ci或utf8mb4_general_ci排序规则。


SQL乱码问题


查看编码


my.ini配置文件




4号知乎网友:爱可生云数据库



官方在后续的 MySQL 版本也会逐渐删除 utf8。


在深入探讨 utf8mb4 的好处之前,我们先澄清一下 utf8mb4 代表什么。在 MySQL 中,“utf8”是指支持 Unicode 字符集的字符编码,每个字符最多使用三个字节。然而,MySQL 中原始的 utf8 实现并没有涵盖所有 Unicode 字符。另一方面,utf8mb4 是 utf8 的修改版本,它支持完整的 Unicode 字符集,包括表情符号和其他补充字符,每个字符最多使用四个字节。


MySQL 中原始的 utf8 实现仅支持基本多文种平面(BMP)中的字符,大约占所有 Unicode 字符的 90%。另一方面,utf8mb4 支持整个 Unicode 字符集,包括表情符号和其他补充字符。它通过每个字符最多使用四个字节而不是 utf8 使用的三个字节来实现此目的。


下表显示了 utf8 和 utf8mb4 之间的区别:



注意:历史上,MySQL 使用字符集 utf8 作为 utf8mb3 的别名。但是,从 MySQL 8.0.28 开始,utf8mb3 仅在 SHOW 语句的输出和信息架构表中引用该字符集时使用。未来,utf8 有望成为 utf8mb4 的参考。为了避免任何歧义,建议在引用该字符集时显式指定 utf8mb4。


如您所见,utf8、utf8mb3 和 utf8mb4 之间的主要区别在于每个字符的最大字节数。utf8 和 utf8mb3 只能存储 BMP 中的字符,而 utf8mb4 还可以存储补充平面(Supplementary Plane)中的字符。这意味着 utf8mb4 可以支持更广泛的字符,包括表情符号、数学符号和其他特殊字符。


这三个字符集之间的另一个区别是它们在 MySQL 中的默认状态。utf8 是 MySQL 5.7 及更早版本中的默认字符集,而 utf8mb3 是 MySQL 8.0 中的默认字符集。但是,utf8mb4 是 MySQL 8.0.28 及更高版本中的默认字符集。


最后,MySQL 8.0 中已弃用 utf8 和 utf8mb3。这意味着它们最终将从 MySQL 中删除,因此建议使用 utf8mb4 代替。


因此,如果您需要存储所有 Unicode 字符,包括表情符号和其他补充字符,那么您应该使用 utf8mb4。但是,如果您只需要存储 BMP 中的字符,那么 utf8 可能就足够了。




5号知乎网友:春秋的呓语



用不等式秒杀

MySQL utf8 ≠ utf8


-

“你和utf8发生过什么惨案故事?”欢迎在留言区交流~



整理丨dbaplus社群

来源丨https://www.zhihu.com/question/630892089

*仅为提供参考和学习交流,不代表dbaplus社群立场!dbaplus社群欢迎广大技术人员投稿,投稿邮箱:editor@dbaplus.cn

相关推荐

使用nginx配置域名及禁止直接通过IP访问网站

前段时间刚搭建好这个网站,一直没有关注一个问题,那就是IP地址也可以访问我的网站,今天就专门研究了一下nginx配置问题,争取把这个问题研究透彻。1.nginx配置域名及禁止直接通过IP访问先来看n...

如何在 Linux 中使用 PID 号查找进程名称?

在Linux的复杂世界中,进程是系统运行的核心,每个进程都由一个唯一的「进程ID」(PID)标识。无论是系统管理员在排查失控进程,还是开发者在调试应用程序,知道如何将PID映射到对应的进程名称都是一项...

Linux服务器硬件信息查询与日常运维命令总结

1.服务器硬件信息查询1.1CPU信息查询命令功能描述示例lscpu显示CPU架构、核心数、线程数等lscpucat/proc/cpuinfo详细CPU信息(型号、缓存、频率)cat/proc/c...

Ubuntu 操作系统常用命令详解(ubuntu常用的50个命令)

UbuntuLinux是一款流行的开源操作系统,广泛应用于服务器、开发、学习等场景。命令行是Ubuntu的灵魂,也是高效、稳定管理系统的利器。本文按照各大常用领域,详细总结Ubuntu必学...

从 0 到 1:打造基于 Linux 的私有 API 网关平台

在当今微服务架构盛行的时代,API网关作为服务入口和安全屏障,其重要性日益凸显。你是否想过,不依赖商业方案,完全基于开源组件,在Linux上构建一个属于自己的私有API网关平台?今天就带你...

Nginx搭建简单直播服务器(nginx 直播服务器搭建)

前言使用Nginx+Nginx-rtmp-module在Ubuntu中搭建简单的rtmp推流直播服务器。服务器环境Ubuntu16.04相关概念RTMP:RTMP协议是RealTi...

Linux连不上网?远程卡?这篇网络管理指南你不能错过!

大家好!今天咱们聊个所有Linux用户都躲不开的“老大难”——网络管理。我猜你肯定遇到过这些崩溃时刻:新装的Linux系统连不上Wi-Fi,急得直拍桌子;远程服务器SSH连不上,提示“Connecti...

7天从0到上线!手把手教你用Python Flask打造爆款Web服务

一、为什么全网开发者都在疯学Flask?在当今Web开发的战场,Flask就像一把“瑞士军刀”——轻量级架构让新手3天速成,灵活扩展能力又能支撑百万级用户项目!对比Django的“重型装甲”,Flas...

nginx配置文件详解(nginx反向代理配置详解)

Nginx是一个强大的免费开源的HTTP服务器和反向代理服务器。在Web开发项目中,nginx常用作为静态文件服务器处理静态文件,并负责将动态请求转发至应用服务器(如Django,Flask,et...

30 分钟搞定 Docker 安装与 Nginx 部署,轻松搭建高效 Web 服务

在云计算时代,利用容器技术快速部署应用已成为开发者必备技能。本文将手把手教你在阿里云轻量应用服务器上,通过Docker高效部署Nginx并发布静态网站,全程可视化操作,新手也能轻松上手!一、准...

Nginx 配置实战:从摸鱼到部署,手把手教你搞定生产级配置

各位摸鱼搭子们!今天咱不聊代码里的NullPointerException,改聊点「摸鱼必备生存技能」——Nginx配置!先灵魂拷问一下:写了一堆接口却不会部署?服务器被恶意请求打崩过?静态资源加载...

如何使用 Daphne + Nginx + supervisor部署 Django

前言:从Django3.0开始支持ASGI应用程序运行,使Django完全具有异步功能。Django目前已经更新到5.0,对异步支持也越来越好。但是,异步功能将仅对在ASGI下运行的应用程序可用...

Docker命令最全详解(39个最常用命令)

Docker是云原生的核心,也是大厂的必备技能,下面我就全面来详解Docker核心命令@mikechen本文作者:陈睿|mikechen文章来源:mikechen.cc一、Docker基本命令doc...

ubuntu中如何查看是否已经安装了nginx

在Ubuntu系统中,可以通过以下几种方法检查是否已安装Nginx:方法1:使用dpkg命令(适用于Debian/Ubuntu)bashdpkg-l|grepnginx输出...

OVN 概念与实践(德育概念的泛化在理论和实践中有什么弊端?)

今天我们来讲解OVN的概念和基础实践,要理解本篇博客的内容,需要前置学习:Linux网络设备-Bridge&VethPairLinux网络设备-Bridge详解OVS+Fa...

取消回复欢迎 发表评论: