文件 · main · xuchaoxin1375 / SER · GitCode

pip3 install -r requirements.txt

File d:\condaPythonEnvs\tf210\lib\site-packages\sklearn\neighbors\_classification.py:237, in KNeighborsClassifier.predict(self, X)
    235     neigh_dist = None
    236 else:
--> 237     neigh_dist, neigh_ind = self.kneighbors(X)
    239 classes_ = self.classes_
    240 _y = self._y

    643 get_config = getattr(self._dynlib, "openblas_get_config",
    644                      lambda: None)
    645 get_config.restype = ctypes.c_char_p
--> 646 config = get_config().split()
    647 if config[0] == b"OpenBLAS":
    648     return config[1].decode("utf-8")

AttributeError: 'NoneType' object has no attribute 'split'
from tqdm import tqdm
import time

for i in tqdm(range(10)):
    time.sleep(0.1)
from tqdm import tqdm
import time

for i in tqdm(range(10), desc="Processing data"):
    time.sleep(0.1)
from tqdm import tqdm
import time

for i in tqdm(range(10), leave=False):
    time.sleep(0.1)
from tqdm import tqdm
from time import sleep
from audio.core import best_estimators
ests=best_estimators()
ests=tqdm(ests)
for x in ests:
    sleep(0.5)
    print(x)
$ccser="D:\repos\CCSER\SER"
setx PYTHONPATH "$ccser;$env:PYTHONPATH"
PS C:\Users\cxxu> $ccser="D:\repos\CCSER\SER"
PS C:\Users\cxxu> $ccser
D:\repos\CCSER\SER

PS D:\repos\configs\env> setx PYTHONPATH "$ccser;$env:PYTHONPATH"

SUCCESS: Specified value was saved.
$path=".";
Get-ChildItem $path -Directory -Recurse | ForEach-Object {
     $count = (Get-ChildItem $_.Name -File).Count
     Write-Output "$($_.Name): $count files"
}
# cxxu_u22 @ cxxuWn11 in /mnt/d/repos/CCSER/SER on git:main x [10:21:23]
$ du -h --max-depth=1 |sort -hr
1.8G    .
1.6G    ./data
96M     ./.git
19M     ./SG
18M     ./.vscode
16M     ./features
14M     ./charts
11M     ./test_playground
4.6M    ./recognizer
1.2M    ./assets
1.1M    ./meta_files
932K    ./audio
92K     ./__pycache__
76K     ./config
32K     ./grid
16K     ./archive
16K     ./.idea
8.0K    ./recognize_result
from sklearn.preprocessing import StandardScaler

# X为特征矩阵，axis=0对每列进行归一化
scaler = StandardScaler()
X = scaler.fit_transform(X)
from sklearn.preprocessing import MinMaxScaler
import librosa

# y为语音信号，sr为采样率
S = librosa.feature.melspectrogram(y=y, sr=sr, n_mels=128, fmax=8000)
log_S = librosa.power_to_db(S, ref=np.max)

# 计算每个帧的能量
frame_energy = np.sum(np.exp(log_S), axis=0)

# 对帧级别的能量进行归一化
scaler = MinMaxScaler()
frame_energy = scaler.fit_transform(frame_energy.reshape(-1, 1)).reshape(-1)
import librosa

# y为语音信号，sr为采样率
S = librosa.feature.melspectrogram(y=y, sr=sr, n_mels=128, fmax=8000)
log_S = librosa.power_to_db(S, ref=np.max)

# 将语音信号转换为分贝表示
db_S = librosa.amplitude_to_db(S, ref=np.max)

# 检测语音活动部分
onset_frames = librosa.onset.onset_detect(y=y, sr=sr)
onset_times = librosa.frames_to_time(onset_frames, sr=sr)
import librosa

# y为语音信号，sr为采样率
y_stretch = librosa.effects.time_stretch(y, rate=0.8)
y_pitch = librosa.effects.pitch_shift(y, sr=sr, n_steps=-3)
y_drc = librosa.effects.dynamic_range_compression(y, threshold=1.0, ratio=4.0)
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import mutual_info_classif

# X为特征矩阵，y为情感标签
selector = SelectKBest(mutual_info_classif, k=10)
X_new = selector.fit_transform(X, y)
from sklearn.datasets import load_iris
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import cross_val_score

# 加载iris(鸢尾花)数据集
X, y = load_iris(return_X_y=True)

# 使用线性回归模型进行交叉验证
model = LinearRegression()

scores = cross_val_score(model, X, y, cv=5)
print("Scores:", scores)
print("Mean score:", scores.mean())
Scores: [0.96666667 0.96666667 0.9        0.96666667 1.        ]
Mean score: 0.9600000000000002
# 加载iris(鸢尾花)数据集
X, y = load_iris(return_X_y=True)

# model=RandomForestClassifier()
model=SVC()
scores = cross_val_score(model, X, y, cv=5,verbose=3)
print("Scores:", scores)
print("Mean score:", scores.mean())
Scores: [0.96666667 0.96666667 0.96666667 0.93333333 1.        ]
Mean score: 0.9666666666666666
# 加载iris(鸢尾花)数据集
X, y = load_iris(return_X_y=True)

# 定义5折交叉验证
kf = KFold(
    n_splits=5,
    #    shuffle=True,
    # random_state=42,
)

# 使用线性回归模型进行训练和测试
model = LinearRegression()
# model=RandomForestClassifier()
scores_cv = []
for train_index, test_index in kf.split(X):
    X_train, X_test = X[train_index], X[test_index]
    y_train, y_test = y[train_index], y[test_index]
    model.fit(X_train, y_train)
    score = model.score(X_test, y_test)
    scores_cv.append(score)
    print("Score:", score)
mean_score = np.mean(scores_cv)
print(f"{mean_score=}")
Score: 0.0
Score: 0.8512492308414581
Score: 0.0
Score: 0.7615543936085848
Score: 0.0
mean_score=0.32256072489000853
Score: 0.9468960016420045
Score: 0.9315787260143983
Score: 0.9177129838664249
Score: 0.9026578332122843
Score: 0.921073136533955
mean_score=0.9239837362538135
Windows 64-bit packages of scikit-learn can be accelerated using scikit-learn-intelex.
More details are available here: https://intel.github.io/scikit-learn-intelex

For example:

$ conda install scikit-learn-intelex
    $ python -m sklearnex my_application.py
meta_files\train_emodb_AS.csv meta_files\test_ravdess_AS.csv
meta_files\test_ravdess_AS.csv @{test_meta_files} in load_data_from_meta
partition='train'
meta_files\train_emodb_AS.csv @{meta_files}in load_data_preprosscing
cast the 'meta_files\train_emodb_AS.csv' to [str]
meta_files\train_emodb_AS.csv @🎈{meta_file}
[I] Loading audio file paths and its corresponding labels...
meta_files: ['meta_files\\train_emodb_AS.csv']
存在meta_files\train_emodb_AS.csv文件!
meta_path='meta_files\\train_emodb_AS.csv'@
db='emodb'@
检查特征文件features\emodb_mfcc_AS_151.npy是否存在...
self.e_config=['angry', 'sad']
特征矩阵文件(.npy)已经存在,直接导入:loading...
(151, 40) @{feature.shape}
[Info] Adding  train samples
partition='test'
meta_files\test_ravdess_AS.csv @{meta_files}in load_data_preprosscing
cast the 'meta_files\test_ravdess_AS.csv' to [str]
meta_files\test_ravdess_AS.csv @🎈{meta_file}
[I] Loading audio file paths and its corresponding labels...
meta_files: ['meta_files\\test_ravdess_AS.csv']
存在meta_files\test_ravdess_AS.csv文件!
meta_path='meta_files\\test_ravdess_AS.csv'@
db='ravdess'@
检查特征文件features\ravdess_mfcc_AS_406.npy是否存在...
self.e_config=['angry', 'sad']
特征矩阵文件(.npy)已经存在,直接导入:loading...
(406, 40) @{feature.shape}
[Info] Adding  test samples
[+] Data loaded
2796338002912
None @{self.model}
Evaluating RandomForestClassifier:   0%|          | 0/5 [00:00<?, ?it/s]
SVC(C=10, gamma=0.001) @{self.model}
RandomForestClassifier(max_depth=7, max_features=0.5, n_estimators=40) @{self.model}
Evaluating KNeighborsClassifier:  40%|████      | 2/5 [00:00<00:00, 14.40it/s]
KNeighborsClassifier(n_neighbors=3, p=1, weights='distance') @{self.model}
Evaluating MLPClassifier:  40%|████      | 2/5 [00:00<00:00, 14.40it/s]       d:\condaPythonEnvs\tf2.10\lib\site-packages\sklearn\neural_network\_multilayer_perceptron.py:603: UserWarning: Got `batch_size` less than 1 or larger than sample size. It is going to be clipped
  warnings.warn(
Evaluating BaggingClassifier:  80%|████████  | 4/5 [00:00<00:00,  6.96it/s]
MLPClassifier(alpha=0.01, batch_size=512, hidden_layer_sizes=(300,),
              learning_rate='adaptive', max_iter=400) @{self.model}
BaggingClassifier(max_features=0.5, n_estimators=50) @{self.model}
Evaluating BaggingClassifier: 100%|██████████| 5/5 [00:00<00:00,  7.09it/s]
[+] Best model : RandomForestClassifier with 77.094% test accuracy
test_score=0.770935960591133
(d:\condaPythonEnvs\tf2.10) PS D:\repos\CCSER\SER> py "d:\repos\CCSER\SER\recognizer\basic.py"
@{model}
partition='train'
D:\repos\CCSER\SER\meta_files\train_ravdess_AS.csv @🎈{meta_file}
[I] Loading audio file paths and its corresponding labels...
meta_file存在D:\repos\CCSER\SER\meta_files\train_ravdess_AS.csv文件!
检查特征文件D:\repos\CCSER\SER\features\ravdess_mfcc_AS_1216.npy是否存在...
self.e_config=['angry', 'sad']
self.f_config=['mfcc']
npy文件不存在,尝试创建...
{} @{self.feature_transforms}🎈
True @{save_obj}
Extracting features for partition:: 100%|███████████████████████████████████████████████████████████| 1216/1216 [00:19<00:00, 63.43it/s]
fts参数key合法
🎈🎈🎈特征提取
(1216, 40) @{feature.shape}
[Info] Adding  train samples
partition='test'
D:\repos\CCSER\SER\meta_files\test_emodb_AS.csv @🎈{meta_file}
[I] Loading audio file paths and its corresponding labels...
meta_file存在D:\repos\CCSER\SER\meta_files\test_emodb_AS.csv文件!
检查特征文件D:\repos\CCSER\SER\features\emodb_mfcc_AS_38.npy是否存在...
self.e_config=['angry', 'sad']
self.f_config=['mfcc']
特征矩阵文件(.npy)已经存在,直接导入:loading...
(38, 40) @{feature.shape}
[Info] Adding  test samples
[I] Data loaded

self.ae=<audio.extractor.AudioExtractor object at 0x0000028D91CE85E0>
self.ae.pca=None🎈
Evaluating <SVC>:   0%|                                                                                           | 0/5 [00:00<?, ?it/s]@{model}

[I] SVC with 0.7105263157894737 test accuracy
Evaluating <RandomForestClassifier>:  20%|████████████▊                                                   | 1/5 [00:05<00:23,  5.80s/it]@{model}
Evaluating <BaggingClassifier>: 100%|█████████████████████████████████████████████████████████████████████| 5/5 [00:14<00:00,  2.99s/it]
[🎈] Best model : RandomForestClassifier with 97.368% test accuracy
train_score=0.9868421052631579verbose=0               precision    recall  f1-score   support

       angry       1.00      0.92      0.96        24
         sad       0.88      1.00      0.93        14

    accuracy                           0.95        38
   macro avg       0.94      0.96      0.94        38
weighted avg       0.95      0.95      0.95        38 RandomForestClassifier
test_score=0.9473684210526315
(1216, 40) (1216,) 🎈
n_splits=5
cv_score=0.9508196721311475
(d:\condaPythonEnvs\tf2.10) PS D:\repos\CCSER\SER>