前言
之前18兄弟推荐我换到astro框架。
这个astro框架我之前了解过,按需加载,0 JavaScript,还支持SSG、SSR和中间件,既可以静态也可以动态。
docs.astro.js.cn
https://docs.astro.js.cn/en/getting-started
↗
目前这个主题我已经使用了五年了,里面堆砌着大大小小的屎山,要是迁移的话算是一次不小的工程。后面考虑了一下,还是继续待在hugo。
既然不准备换到astro,那么就借鉴一下astro的优点,取长补短。
周末花了一点时间给博客做了一波JS按需加载优化,效果还不错——首页JS从800KB直接砍到了350KB。
打开Chrome DevTools的Network测试了一下,最影响加载速度的还是字体文件。从开始使用这个主题到现在一直使用的这个字体,看习惯了,也没必要因为字体文件大就换。看了一下字体文件大小大概有1.2MB,反正比我的JS还大。
说起来,之前也写过一篇用fontspider压缩字体的文章,不过那个工具年久失修,对静态博客支持不太好。最近正好在学Python,发现了一个更好用的工具——fonttools。
这篇就跟各位朋友来聊聊怎么用fonttools,给字体瘦瘦身。
为什么字体文件这么大?
先给大家科普一下,为什么中文字体动不动就几MB。
中文字和英文字不一样。英文字母就26个大小写,加上数字和符号,撑死几百个字符。但中文呢?《通用规范汉字表》收录了8105个汉字,如果算上生僻字,得有好几万。
而字体文件里面,是把所有字符的字形都打包进去的。也就是说,不管你用没用到“龘”这个字,它都在你的字体文件里躺着,白白占空间。
但实际上,一个博客能用到多少字呢?我统计了一下我的博客,也就2500个字符左右。
1.2MB的字体,实际只需要700多KB,剩下的都是浪费。
解决方案:Python + fonttools
什么是fonttools?
fonttools是一个Python库,专门用来处理字体文件。它能做很多事情,比如读取字体信息、转换格式、提取字符等等。
我们要用到的功能是字体子集化(Font Subsetting)——简单来说,就是只保留我们用到的字符,把其他的都扔掉。
安装环境
首先,你需要安装Python。这个就不多说了,去官网下载安装就行:
www.python.org
https://www.python.org/downloads/
↗
安装的时候记得勾选 “Add Python to PATH”,这样就能在命令行里直接用了。
装好之后,打开cmd,输入:
python --version
能看到版本号就说明装好了。
然后安装fonttools和brotli(用于压缩):
pip install fonttools brotli
如果提示权限不够,加上 --break-system-packages:
pip install fonttools brotli --break-system-packages
编写优化脚本
我写了一个Python脚本,可以自动扫描博客的所有内容,提取用到的字符,然后生成精简版字体。
如果你是Hugo框架,可以直接套用我的脚本;如果是其他框架,可以把这篇文章或者关键词喂给AI,也是同理。
首先在项目根目录创建一个文件:scripts/subset-font-safe.py
#!/usr/bin/env python3
"""
字体子集化脚本
从HTML和CSS文件中提取实际使用的字符,生成优化的子集字体
"""
import os
import re
from fontTools.ttLib import TTFont
from fontTools.subset import Subsetter, Options
def extract_chars_from_files(directories):
"""从文件中提取使用的字符"""
chars = set()
for directory in directories:
if not os.path.exists(directory):
print(f"⚠️ 目录不存在,跳过: {directory}")
continue
print(f"🔍 扫描目录: {directory}")
for root, dirs, files in os.walk(directory):
for file in files:
if file.endswith(('.html', '.md', '.css')):
filepath = os.path.join(root, file)
try:
with open(filepath, 'r', encoding='utf-8') as f:
content = f.read()
# 提取中文字符
chinese_chars = re.findall(r'[一-鿿]', content)
chars.update(chinese_chars)
# 提取英文和数字
ascii_chars = re.findall(r'[a-zA-Z0-9]', content)
chars.update(ascii_chars)
# 提取常用标点
en_punct = set('!@#$%^&*()_+-=[]{}|;:,.<>?/\\`~"\'-')
chars.update(en_punct)
except Exception as e:
print(f"⚠️ 读取失败 {filepath}: {e}")
return chars
def main():
print("🔤 字体子集化工具")
print("=" * 50)
# 配置路径
font_dir = "themes/Ying/static/font"
input_font = os.path.join(font_dir, "zql-v2.woff2")
chars_file = os.path.join(font_dir, "used_chars.txt")
# 检查输入文件
if not os.path.exists(input_font):
print(f"❌ 字体文件不存在: {input_font}")
return
# 读取现有的字符列表(如果有)
existing_chars = set()
if os.path.exists(chars_file):
with open(chars_file, 'r', encoding='utf-8') as f:
existing_chars = set(f.read())
print(f"📖 读取现有字符: {len(existing_chars)} 个")
# 扫描目录
scan_dirs = ["content", "layouts"]
if os.path.exists("public"):
scan_dirs.append("public")
# 提取字符
new_chars = extract_chars_from_files(scan_dirs)
print(f"📝 从文件提取了 {len(new_chars)} 个字符")
# 合并字符(保留手动添加的字符)
all_chars = existing_chars | new_chars
print(f"📊 合并后: {len(all_chars)} 个字符")
# 保存字符列表
with open(chars_file, 'w', encoding='utf-8') as f:
f.write(''.join(sorted(all_chars)))
# 生成woff2子集
output_woff2 = os.path.join(font_dir, "zql-v2-subset.woff2")
print(f"\n🎯 生成 woff2 子集字体...")
font = TTFont(input_font)
options = Options()
options.flavor = 'woff2'
subsetter = Subsetter(options=options)
subsetter.populate(text=''.join(all_chars))
subsetter.subset(font)
font.save(output_woff2)
# 计算优化效果
original_size = os.path.getsize(input_font)
subset_size = os.path.getsize(output_woff2)
reduction = original_size - subset_size
percentage = (reduction / original_size) * 100
print(f"\n✅ 优化完成!")
print(f"📊 原始大小: {original_size / 1024:.1f} KB")
print(f"📊 子集大小: {subset_size / 1024:.1f} KB")
print(f"📊 减少: {reduction / 1024:.1f} KB ({percentage:.1f}%)")
if __name__ == "__main__":
main()
脚本主要干了什么?
其实这个脚本的逻辑很简单,主要分三步:
- 扫描:遍历
content、layouts、public目录,找出所有用到的字符。 - 提取:把中文、英文、数字、标点符号都提取出来。
- 生成:用fonttools生成只包含这些字符的字体。
这里有个细节:脚本会读取 used_chars.txt 里手动添加的字符。这样如果你有一些特殊字符(比如我博客里的古风官职表),可以手动加进去,不会被覆盖。
运行效果
首先,确保你已经构建过Hugo:
hugo --destination=public
然后运行脚本:
python scripts/subset-font-safe.py
我这边的运行结果:
🔤 字体子集化工具
==================================================
📖 读取现有字符: 2489 个
🔍 扫描目录: content
🔍 扫描目录: layouts
🔍 扫描目录: public
📝 从文件提取了 2492 个字符
📊 合并后: 2500 个字符
🎯 生成 woff2 子集字体...
✅ 优化完成!
📊 原始大小: 1226.6 KB
📊 子集大小: 740.7 KB
📊 减少: 485.9 KB (39.6%)
1.2MB的字体,优化后只剩740KB,减少了40%!
更新CSS
字体文件生成了,还需要把你的字体CSS文件替换一下路径。打开 themes/Ying/assets/css/main.css,找到字体声明:
@font-face {
font-family: 'zql';
src: url('../font/zql-v2.woff2') format('woff2'),
url('../font/zql-v2.woff') format('woff');
font-display: swap;
unicode-range: U+0000-007F, U+4E00-9FFF, U+2000-206F, U+3000-303F;
}
改成:
@font-face {
font-family: 'zql';
src: url('../font/zql-v2-subset.woff2') format('woff2'),
url('../font/zql-v2-subset.woff') format('woff');
font-display: swap;
unicode-range: U+0000-007F, U+4E00-9FFF, U+2000-206F, U+3000-303F;
}
这样就OK了,还是很简单的。如果你觉得手动执行py脚本比较麻烦,其实编写GitHub Action自动处理字体也是一个不错的选择。