Important
用途:读 audio / LLM 论文时攒下来的高频英文词。每遇到一个新的就添一行,最后一列“论文中遇到时的第一反应”比中文释义更重要——词意上网查就行,词在论文里的作者语气 / 常见搭配 / 隐含图谋才是读不懂的根源。
用法约定
-
按首字母分区,方便查找;数量少时可以合并成一张表。
-
词条字段:词 / 词性 / 中文 / 论文里的典型含义 / 记忆抓手。
-
来自的论文用尾注形式标,便于回查上下文。
-
“记忆抓手”写的是射箋——下次在别的 paper 里再遇到的时候,有没有一句能让你立刻想起意思的钩子。
A
articulate
-
词性:动词 / 形容词(重音位置不同:动词 尾音 -leit,形容词 尾音 -let)
-
中文:
-
动词:清晰地表达 / 明确阐述 / 分节说清楚
-
形容词:表达清晰的 / 能说会道的(夸人)
-
-
论文典型用法:
-
“We articulate a clear distinction between A and B.” = 我们明确分开了 A 和 B。
-
“articulate the problem / the vision / the differences” = 把问题 / 愿景 / 差异有条理地讲出来,不只是“说了”。
-
负面用法:“The authors fail to articulate …” = reviewer 在骂“你没讲清楚”。
-
-
记忆抓手:词根 articulus = 小关节 / 接头(同源 article 、articulation)。articulate = “把话一节一节分清楚地说出来”——比 say 多了“分节”、比 express 多了“有结构”。
B
bypassing
-
词性:动词 bypass 的现在分词 / 动名词
-
中文:绕过、绕开、跳过
-
论文典型用法:bypassing ASR / bypassing the text intermediate——端到端 audio LLM “不走中间文本这一步”的标准措辞。
-
记忆抓手:pass = 走这条路,bypass = 从旁边绕过去。见到 bypassing X 就问:X 是哪个中间站?作者为什么觉得它碍事?
C
colloquial / colloquialism
-
词性:
-
colloquial = 形容词
-
colloquialism = 名词(抽象不可数 / 具体可数两种)
-
-
中文:
-
colloquial = 口语的 / 口语化的 / 非正式的
-
colloquialism = 口语性 / 口语表达
-
-
对立面:formal(正式)/ literary(文学/书面)/ written(书面)。
-
论文典型用法:
-
指模型回答时是否像真人在说话(用自然口语词、有语气词、有省略)。 WavBench- Benchmarking Reasoning, Colloquialism, and Paralinguistics for End-to-End Spoken Dialogue Models
-
WavBench 里 “Colloquial Expression” 是顶层两大分支之一(Basic + Pro合称),和 “Acoustic Interaction” 并列。结构是 2×2:Colloquial Expression(Basic/Pro)× Acoustic Interaction(叶节点共 3 个 subset,所以作者叫 tripartite,但顶层骨架是 2×2 而不是平铺三分)。
-
常见搭配:colloquial language / colloquial speech / colloquial register / colloquial tone。
-
-
记忆抓手:col-(一起)+ loqui-(说话,同源 loquacious 健谈的、eloquent 雄辩的、soliloquy 独白)= “一起说话” = 对谈 / 闲聊。colloquial = 有对谈味的;colloquialism = 有对谈味这件事本身。
comprise
-
词性:动词(及物)
-
中文:包含 / 由…构成 / 由…组成
-
论文典型用法:“Our benchmark comprises three tiers.” / “WavBench comprises 17,577 items across five subsets.”——描述整体由哪几部分构成,主语是整体、宾语是部分。
-
陷阱(reviewer 会抓的):常见错写 “X is comprised of Y”——Merriam-Webster、Chicago Style Guide 均标为 nonstandard。安全写法:
-
主动:“X comprises Y” ✅
-
被动:“X is composed of Y” ✅ 或 “X consists of Y” ✅
-
避免:“X is comprised of Y” ❌
-
-
记忆抓手:口诀「the whole comprises the parts」——整体吃掉部分。反过来是 compose:部分组合成整体(the parts compose the whole)。混了就翻车。
be confined to
-
词性:动词短语的被动式(动词 confine、名词 confinement)
-
中文:被限制在 X 范围内 / 局限于 X
-
论文典型用法:作者用来给现有工作画天花板的模板句:“Prior work is largely confined to …” / “These models are confined to …”——紧跟的就是作者说自己怎么突破这个限制。常见于 intro 发射阶段。
-
记忆抓手:confine = con-(完全)+ fin-(边界,同源 finish/finite)= “完全关在边界里”。与 limited to(中性)、restricted to(外部约束)相比,confined to 画面感最强、贬义最重——作者在暗示“这不是暂时限制,是方法骨架本身就困在里面”。
D
discourse markers
-
词性:名词短语(复数形式)
-
中文:话语标记 / 语篇标记
-
论文典型用法:指口语中那些“不承担命题意义、但承担对话组织功能”的小词——英文的 well / you know / I mean / actually / so / like / right / okay / anyway,中文对应“那个 / 就是 / 其实 / 然后 / 对”。Spoken dialogue 评测里常用“模型会不会自然地插 discourse markers”来判断 colloquialism 是否到位。
-
记忆抓手:discourse = 话语 / 语篇,marker = 标记物。discourse markers ≈ “说话时的润滑剂”——去掉它们句子照样说得通,但听起来像在背课文。
E
explicit / implicit
-
词性:形容词(成对出现,一起记)
-
中文:
-
explicit = 显式的 / 明说的 / 写出来的
-
implicit = 隐式的 / 暗含的 / 不明说的
-
-
论文典型用法:
-
WavBench Acoustic subset 就是拿这对词切的:Explicit Understanding(用户直接问副语言)/ Explicit Generation(用户直接要求特定语气)/ Implicit Dialogue(用户不提,模型要自己从语音线索里接住)。 WavBench- Benchmarking Reasoning, Colloquialism, and Paralinguistics for End-to-End Spoken Dialogue Models
-
其他高频搭配:implicit bias(隐性偏见)、implicit supervision(隐式监督)、implicit reasoning(隐式推理——不写显式 CoT、在 latent 空间里推,这个术语会在 latent thinking 论文里反复出现)。
-
-
记忆抓手:ex- = 往外(export、exit)→ explicit = “摆在外面的”;im- = 往里(impact、import)→ implicit = “藏在里面的”。Implicit 档总是最难的测试集——模型被考察的是「是否自发看到」而不是「被命令看」。
F
fidelity
-
词性:名词(不可数)
-
中文:保真度 / 忠实度 / 还原度。词根 fides = 信念 / 忠诚(同源 faith、confide)。
-
核心感觉:原始的东西经过复制/传递/生成之后,有多少被保留下来。永远隐含一个“参考源”——看到 fidelity 第一件事问:作者在和什么比?
-
论文典型用法:
-
paralinguistic fidelity = 副语言保真度(要求生气的语气,是不是真的生气)
-
reconstruction fidelity = 重建保真度(VAE / codec 论文高频,和输入比)
-
high-fidelity audio = 高保真音频(Hi-Fi 音响黑话中的 Fi)
-
-
与近义词的差别:accuracy = 对不对(离散)、quality = 好不好(泛指)、fidelity = 和参考源比到底还原得像不像。
-
记忆抓手:Hi-Fi 音响、confide(倾诉真心)、fidelity 一脉相承——都是“守住原样”的意思。
H
holistic
-
词性:形容词
-
中文:整体的 / 全局的 / 综合的
-
论文典型用法:holistic framework / holistic evaluation——作者自我表扬用词,意思是“我不偏科、覆盖全”。
-
记忆抓手:holos = whole。看到翻成“整盘来看”,顺手打个问号:真的全吗?漏了什么没?
I
intersection
-
词性:名词(动词 intersect)
-
中文:交集 / 交叉处 / 交汇点
-
论文典型用法:判不离一个固定搭配 “at the intersection of X and Y”——作者用来给自己定位,暗台词是「我站在两个领域的交界处、属于稀缺生态位」。例:“at the intersection of audio modeling and reasoning” / “at the intersection of paralinguistic understanding and dialogue generation”。
-
该怀疑什么:听到 at the intersection of X and Y 站住问:**X 和 Y 真的独立吗?**真正有含金量的 intersection 要求 X 和 Y 本来不怎么打交道。如果两个领域本来就重叠 80%,吃 intersection 绿利是能还没助。
-
记忆抓手:inter-(之间)+ sect(切,同源 section、dissect)= “在之间切一刀”。数学符号 ∩ 就像两条线交汇后的帽子。
inherently
-
词性:副词(形容词 inherent)
-
中文:本质上、天生就、结构上
-
论文典型用法:强调“不是工程没做好,而是架构 / 设计骨架就这样定的”。作者说 “inherently separated” = 在否定现有方案的根基。
-
记忆抓手:inherent 和 inherit(继承)同根——“古定在里面的属性”。
intimacy
-
词性:名词(不可数;形容词 intimate /ˈɪntəmət/;动词 intimate /ˈɪntəmeɪt/ = 暗示 / 透露,重音不同)
-
中文:亲密感 / 亲近感 / 亲密关系。词根 intim- 来自拉丁语 intimus = “最里面的”(in 的最高级)。
-
论文典型用法:spoken dialogue 论文 intro 标配词,用来给 audio LLM 方向找合法性:“Voice-based interaction fosters a sense of intimacy that text cannot replicate.”
-
该怀疑什么:intimacy 是好听的软指标——作者爱用,但很少量化。看到顺手看作者有没有给出代理指标(user preference / engagement / emotional response)。没有的话 = rhetorical flourish,不是论证。
-
近义词差别:rapport = 互动中的默契(双向/即时)、intimacy = 亲近感(可长期、含“私人性”)、warmth = 温暖感(语气层)、connection = 连接感(最泛)。严谨作者会区分。
-
记忆抓手:和 ultimate(最末端)同源逻辑——intim- 是「最里面」,ultim- 是「最末端」。intimacy = “最里面那层关系”。
intricate
-
词性:形容词
-
中文:错综复杂的 / 精密缠绕的
-
论文典型用法:intricate logic / intricate reasoning——强调推理每一步咬前一步,不是堆步数。
-
记忆抓手:complex = 零件多、complicated = 让人头大、intricate = 缠得精细。偏褒义。
L
lexical
-
词性:形容词(名词 lexicon)
-
中文:词汇的 / 词语层面的
-
论文典型用法:lexical choice(选词)、lexical diversity(词汇丰富度)、lexical features(词汇特征)——专指“用了什么词”这一层,与 phonetic(语音)/ syntactic(句法)/ semantic(语义)并列。Spoken dialogue 论文里“lexical naturalness” = 选词是不是口语化。
-
记忆抓手:lexicon = 词典。lexical = “词典层面”的。看到 lexical 就想“词表 / 选哪个词”,比 linguistic 粒度更小、更具体。
linguistic / paralinguistic
-
词性:形容词
-
中文:linguistic = 语言的,paralinguistic = 副语言的 / 伴随语言的
-
论文典型用法:
-
linguistic = “说了什么”(词 / 语法 / 语义)
-
paralinguistic = “怎么说的”(语调 / 语速 / 音量 / 音高 / 情绪 / 口音 / 年龄 / 性别)。ASR 转文本后掉掉的那一层就是它。 WavBench- Benchmarking Reasoning, Colloquialism, and Paralinguistics for End-to-End Spoken Dialogue Models
-
-
记忆抓手:para- = 旁边 / 伴随。paralinguistic = “话外的信息”。audio LLM 存在的根本理由就是接住这层。
Q
quotient
-
词性:名词
-
中文:商、指数(数学);“商空间 / 商群”(代数几何)
-
论文典型用法:
-
日常英语:IQ = Intelligence Quotient 智商、EQ = Emotional Quotient 情商
-
数学论文:quotient space 商空间 / quotient group 商群 —— 把某种等价关系下相等的元素合并后得到的新结构
-
-
记忆抓手:在 ML/audio 论文里看到 “quotient gap” 这类非标准搭配,先怀疑作者自造词 / 或者看错了——回头验明上下文。
R
rapport
-
词性:名词(法语借词,词尾 t 不发音)
-
中文:融洽关系 / 默契感
-
论文典型用法:interactive rapport——强调模型说话像在“接话茄”而不是“对空气读稿子”。WavBench Basic subset 列为 listenability 三要素之一。 WavBench- Benchmarking Reasoning, Colloquialism, and Paralinguistics for End-to-End Spoken Dialogue Models
-
记忆抓手:ra-旁次重音,不要读成 ra-port。词根 = “傳送回來”,两个人信号接得住。
rhetorical
-
词性:形容词(名词 rhetoric)
-
中文:修辞的 / 修辞性的
-
论文典型用法:
-
rhetorical question = 反问句(不期待回答,用来加强语气:“这还用问吗?”)
-
rhetorical structure / rhetorical strategy = 文章的修辞结构 / 写作策略
-
负面用法:作者说某段话是 “empty rhetorical flourish” / “merely rhetorical” = “只是漂亮话、经不起推敷”。
-
-
记忆抓手:rhetoric = 修辞学(古希腊三艺:语法 / 逻辑 / 修辞)。关键对比:logical(讲对不对)vs rhetorical(讲说得漂不漂亮)。论文里看到作者用 rhetorical 形容别人的工作,顺手警觉——常带轻贬,暗示“这话经不起推敷”。
rigorously
-
词性:副词(形容词 rigorous、名词 rigor)
-
中文:严格地 / 严谨地
-
论文典型用法:作者自报评测标准时的常用词,隐含台词是“我的评测不水”。等价于 strictly / thoroughly。
-
记忆抓手:rigor = 严厉。读到时心里顺手验一下:你接下来真要让我看到严格的方法学吗?
T
tripartite
-
词性:形容词
-
中文:三部分的 / 三方的 / 三分层的
-
论文典型用法:tripartite framework——“三分层框架”。WavBench 用它指 Pro / Basic / Acoustic 三档。 WavBench- Benchmarking Reasoning, Colloquialism, and Paralinguistics for End-to-End Spoken Dialogue Models
-
记忆抓手:tri- = 三(triangle、trilogy、tripod),-partite = 分部分的。同样拼法还有 bipartite graph(二分图)。
添加新词的节奏
-
遇到此刻看不懂的新词,先把它在论文里的原句记下,不用立刻查清。
-
一篇 paper 读完再一批处理,对着原句查意思 + 打印象:
-
实义词(paralinguistic 、fidelity 等):记入词汇表。
-
学术套话(rigorously、holistic、intricate):记入词汇表,但关注作者用它们是想暗示什么立场。
-
连接词 / 虚词(bypassing、inherently):记住它们在论文里的固定搭配。
-
-
Arya 在解释时会尽量给“记忆抓手”,你回来补到对应词条下即可。