NullOfflineVideoTranslator/install.py at main · NullCoreDeveloper/NullOfflineVideoTranslator · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
import os
import sys
import subprocess
import shutil
import venv
import time

def print_header(msg):
    print(f"\n{'='*50}\n🚀 {msg}\n{'='*50}")

def run_command(cmd, desc):
    print(f"Выполняю: {desc}...")
    result = subprocess.run(cmd, shell=True)
    if result.returncode != 0:
        print(f"❌ Ошибка при выполнении: {desc}")
        sys.exit(1)
    print("✅ Успешно!\n")

def check_python():
    print_header("Проверка версии Python")
    if sys.version_info < (3, 10):
        print("❌ Требуется Python версии 3.10 или выше.")
        sys.exit(1)
    print(f"✅ Установлен Python {sys.version_info.major}.{sys.version_info.minor}")

def setup_venv():
    print_header("Настройка виртуального окружения")
    venv_dir = os.path.join(os.getcwd(), ".venv")

    if not os.path.exists(venv_dir):
        print("Создание виртуального окружения .venv...")
        venv.create(venv_dir, with_pip=True)
        print("✅ Виртуальное окружение создано.")
    else:
        print("✅ Виртуальное окружение уже существует.")

    # Check if we are running inside the venv
    if sys.prefix == sys.base_prefix:
        print("\n⚠️ ВНИМАНИЕ: Вы запустили скрипт вне виртуального окружения!")
        print("Сейчас я автоматически перезапущу этот скрипт внутри .venv...\n")

        # Determine the path to the venv python executable
        if os.name == 'nt':
            python_exec = os.path.join(venv_dir, "Scripts", "python.exe")
        else:
            python_exec = os.path.join(venv_dir, "bin", "python")

        subprocess.run([python_exec, __file__])
        sys.exit(0) # Exit the outer script

def check_system_deps():
    print_header("Проверка системных зависимостей")
    if shutil.which("ffmpeg") is None:
        print("❌ FFmpeg не найден!")
        print("Пожалуйста, установите FFmpeg:")
        print("Ubuntu/Debian: sudo apt install ffmpeg")
        print("Mac (Homebrew): brew install ffmpeg")
        print("Windows: Скачайте и добавьте в PATH (или через winget install ffmpeg)")
        sys.exit(1)

    if shutil.which("rubberband") is None:
        print("❌ rubberband-cli не найден!")
        print("Пожалуйста, установите rubberband (нужен для умного растяжения звука):")
        print("Ubuntu/Debian: sudo apt install rubberband-cli")
        print("Mac (Homebrew): brew install rubberband")
        print("Windows: Скачайте ZIP-архив с официального сайта (https://breakfastquay.com/rubberband/)")
        print("         распакуйте и добавьте путь к rubberband.exe в системный PATH.")
        sys.exit(1)

    print("✅ Системные зависимости (FFmpeg, Rubberband) установлены.")

def install_python_deps():
    print_header("Установка Python зависимостей")
    run_command("pip install -r requirements.txt", "Установка базовых библиотек из requirements.txt")

    print("\nУстановка WhisperX в режиме совместимости (обход ограничений версий)...")
    whisperx_cmd = (
        "rm -rf whisperx_local && "
        "git clone https://github.com/m-bain/whisperx.git whisperx_local && "
        "sed -i '/requires-python/d' whisperx_local/pyproject.toml && "
        "pip install ./whisperx_local --no-deps && "
        "rm -rf whisperx_local"
    )
    run_command(whisperx_cmd, "Кастомная сборка и установка WhisperX")

def setup_env_vars():
    print_header("Настройка API ключей (.env)")

    env_path = ".env"
    env_vars = {}

    if os.path.exists(env_path):
        with open(env_path, "r") as f:
            for line in f:
                if "=" in line and not line.strip().startswith("#"):
                    k, v = line.strip().split("=", 1)
                    env_vars[k] = v

    # HuggingFace Token
    print("\n[HuggingFace Token]")
    print("Нужен для скачивания нейросетей (XTTS, WhisperX/Pyannote).")
    print("1. Зарегистрируйтесь на https://huggingface.co/")
    print("2. Зайдите в Settings -> Access Tokens и создайте токен (Read).")
    print("3. ВАЖНО: Перейдите на https://hf.co/pyannote/speaker-diarization-3.1 и примите пользовательское соглашение!")

    hf_token = env_vars.get("HF_TOKEN", "")
    if hf_token:
        print(f"Текущий токен: {hf_token[:5]}...{hf_token[-5:]}")
        change = input("Хотите изменить его? (y/N): ").strip().lower()
        if change == 'y':
            hf_token = input("Введите новый HF_TOKEN: ").strip()
    else:
        hf_token = input("Введите HF_TOKEN: ").strip()

    env_vars["HF_TOKEN"] = hf_token

    # Gemini Token
    print("\n[Gemini API Key]")
    print("Нужен для перевода текста (Gemini 1.5 Flash/Pro).")
    print("Получить можно здесь: https://aistudio.google.com/app/apikey")

    gemini_key = env_vars.get("GEMINI_API_KEYS", "")
    if gemini_key:
        print(f"Текущий ключ: {gemini_key[:5]}...{gemini_key[-5:]}")
        change = input("Хотите изменить его? (y/N): ").strip().lower()
        if change == 'y':
            gemini_key = input("Введите новый GEMINI_API_KEYS (можно несколько через запятую): ").strip()
    else:
        gemini_key = input("Введите GEMINI_API_KEYS: ").strip()

    env_vars["GEMINI_API_KEYS"] = gemini_key

    # Proxy (Optional)
    print("\n[Proxy]")
    proxy = env_vars.get("PROXY_URL", "")
    if proxy:
        print(f"Текущий прокси: {proxy}")
        change = input("Хотите изменить/удалить? (y/N): ").strip().lower()
        if change == 'y':
            proxy = input("Введите PROXY_URL (например socks5h://127.0.0.1:1080) или оставьте пустым: ").strip()
    else:
        proxy = input("Введите PROXY_URL (если нужен для обхода блокировок Gemini) или нажмите Enter: ").strip()

    if proxy:
        env_vars["PROXY_URL"] = proxy
    elif "PROXY_URL" in env_vars:
        del env_vars["PROXY_URL"]

    # Write to .env
    with open(env_path, "w") as f:
        for k, v in env_vars.items():
            f.write(f"{k}={v}\n")
    print("\n✅ Файл .env успешно сохранен!")
    return env_vars["HF_TOKEN"]

def download_and_quantize_xtts(hf_token):
    print_header("Скачивание и квантование моделей XTTSv2 (ONNX)")

    try:
        from huggingface_hub import hf_hub_download
    except ImportError:
        print("❌ Не найдена библиотека huggingface_hub.")
        print("Убедитесь, что шаг установки зависимостей прошел успешно.")
        sys.exit(1)

    repo_id = "pltobing/XTTSv2-Streaming-ONNX"
    files_to_download = [
        "xtts_onnx_orchestrator.py",
        "xtts_streaming_pipeline.py",
        "xtts_tokenizer.py",
        "zh_num2words.py",
        "xtts_onnx/metadata.json",
        "xtts_onnx/vocab.json",
        "xtts_onnx/mel_stats.npy",
        "xtts_onnx/conditioning_encoder.onnx",
        "xtts_onnx/speaker_encoder.onnx",
        "xtts_onnx/hifigan_vocoder.onnx",
        "xtts_onnx/embeddings/mel_embedding.npy",
        "xtts_onnx/embeddings/mel_pos_embedding.npy",
        "xtts_onnx/embeddings/text_embedding.npy",
        "xtts_onnx/embeddings/text_pos_embedding.npy",
        "xtts_onnx/gpt_model.onnx"
    ]

    local_dir = "xtts_models"

    # If we find an INT8 model but no FP32 model from a previous run, delete the dir to force a clean redownload
    if os.path.exists(os.path.join(local_dir, "xtts_onnx", "gpt_model_int8.onnx")) and not os.path.exists(os.path.join(local_dir, "xtts_onnx", "gpt_model.onnx")):
        print("🗑️ Обнаружена старая сжатая (INT8) модель. Удаляю для чистой загрузки FP32-оригинала...")
        import shutil
        shutil.rmtree(local_dir)

    os.makedirs(local_dir, exist_ok=True)

    print("Скачивание файлов с HuggingFace (это может занять время)...")
    for f in files_to_download:
        dest_path = os.path.join(local_dir, f)

        # Skip downloading heavy gpt_model.onnx if we already quantized it
        if f == "xtts_onnx/gpt_model.onnx" and os.path.exists(os.path.join(local_dir, "xtts_onnx/gpt_model_int8.onnx")):
            print(f"✅ Квантованная модель gpt_model_int8.onnx уже существует. Пропуск скачивания оригинала.")
            continue

        if not os.path.exists(dest_path):
            print(f"Скачиваю {f}...")
            try:
                hf_hub_download(repo_id=repo_id, filename=f, local_dir=local_dir, token=hf_token)
            except Exception as e:
                print(f"❌ Ошибка скачивания {f}: {e}")
                print("Проверьте валидность HF_TOKEN и подключение к интернету.")
                sys.exit(1)
        else:
            print(f"✅ {f} уже существует. Пропуск.")

    import config
    # Quantization
    gpt_fp32 = os.path.join(local_dir, "xtts_onnx", "gpt_model.onnx")
    gpt_int8 = os.path.join(local_dir, "xtts_onnx", "gpt_model_int8.onnx")

    if not config.USE_INT8_QUANTIZATION:
        print("\n✅ Сохранение оригинальной модели (FP32) для максимальной скорости на GPU...")
        if not os.path.exists(gpt_fp32):
            print("❌ Не найдена оригинальная модель GPT (FP32)!")
            sys.exit(1)
    else:
        print("\n⚙️ Квантование основной модели GPT (FP32 -> INT8) для ускорения процессора...")
        from onnxruntime.quantization import quantize_dynamic, QuantType
        import time

        if os.path.exists(gpt_fp32):
            if not os.path.exists(gpt_int8):
                print(f"Начинаю сжатие {gpt_fp32}...")
                start_time = time.time()
                quantize_dynamic(
                    model_input=gpt_fp32,
                    model_output=gpt_int8,
                    weight_type=QuantType.QUInt8,
                )
                print(f"Сжатие завершено за {time.time() - start_time:.2f} сек.")
                print(f"Оригинал: {os.path.getsize(gpt_fp32)/1024/1024:.2f} MB -> Сжатая: {os.path.getsize(gpt_int8)/1024/1024:.2f} MB")

                print("Удаляю оригинальную тяжелую модель для экономии места...")
                os.remove(gpt_fp32)
            else:
                print("Сжатая модель уже существует, оригинал удаляется...")
                os.remove(gpt_fp32)
        elif os.path.exists(gpt_int8):
            print("✅ Квантованная модель (INT8) уже готова.")
        else:
            print("❌ Не найдена ни оригинальная, ни сжатая модель GPT!")
            sys.exit(1)

    print("\nВключение GPU (CUDA) ускорения для XTTS...")
    orch_path = os.path.join(local_dir, "xtts_onnx_orchestrator.py")
    if os.path.exists(orch_path):
        with open(orch_path, 'r') as f:
            code = f.read()
        code = code.replace('["CPUExecutionProvider"]', '["CUDAExecutionProvider", "CPUExecutionProvider"]')
        with open(orch_path, 'w') as f:
            f.write(code)
        print("✅ CUDA Execution Provider активирован для локального ПК!")

def main():
    print_header("Установщик Video Translator (XTTS + WhisperX)")
    check_python()
    setup_venv()

    # Everything below this point runs INSIDE the venv
    check_system_deps()
    install_python_deps()

    hf_token = setup_env_vars()

    download_and_quantize_xtts(hf_token)

    print_header("УСТАНОВКА ЗАВЕРШЕНА!")
    print("Все компоненты успешно скачаны, сжаты и настроены.")
    print("Теперь вы можете запускать перевод видео командой:")
    print("source .venv/bin/activate")
    print("./run.sh video.mp4")

if __name__ == "__main__":
    main()