信号处理基本参数

time series

时间序列,通常音频信号 y 是一维浮点值数组 numpy.adarray
y[t] 对应于这个数组中位于 t 点的幅度值。

sampling rate

时间序列每秒的采样数(正整数),用 sr 表示。

frame

用于分析目的的时间序列的一小段,这通常对应于频谱图矩阵的单个列。

window

在计算频谱图时用于对一帧内的样本甲醛的矢量或函数。

frame length

分析窗口或框架中样本的数量(正整数),这由一个整数变量表示 n_fft

hop length

窗口每部滑动距离(跳长)连续帧(例如声谱图的列)之间的样本数。这被表示成正整数 hop_length

window length

窗口功能(如 Hann 窗)的长度(宽度)。注意,它可以小于短时傅里叶变换中使用的帧长度,通常表示为整数变量 win_length

spectrogram

频谱图,一个矩阵 S,其中行索引(频点),列索引(时间)。频谱图可以是实值或复值。按照惯例,实值频谱表示为 numpy.ndarray 小写 s,而复数 STFT 矩阵表示为 D

onset (strength) envelope

起始(强度)包络,onset_env[t] 用来衡量框架音符起始的强度 t。通常存储为浮点值的一维 numpy.ndarrayonset_envelope

chroma

音级,也称为 pitch class profile (PCP)。表示测量给定帧/时间下每个音调类别(例如,色阶中的12个音符)的相对能量。

ai
本作品采用《CC 协议》,转载必须注明作者和本文链接
不要试图用百米冲刺的方法完成马拉松比赛。
讨论数量: 0
(= ̄ω ̄=)··· 暂无内容!

请勿发布不友善或者负能量的内容。与人为善,比聪明更重要!