[О блоге] [наверх] [пред] [2024-03-18 10:09:35+03:00] [0a1f29f947892a13635bec94abdabcd1e9c55179]
Темы: [multimedia]

whisper.cpp то может и не работать

https://github.com/ggerganov/whisper.cpp/issues/1949
Поставил я тут распознаваться подкасты linkmeup-а
(46e4d23a23a10eb1c05e5a20f0ceeebd5ff31016). Наобум взял один
результирующий .txt файл и увидел:

    [00:50:46.080 --> 00:50:47.080]   Внутри нашего, например, дата-центра, 800-гига-модов.
    [00:50:47.080 --> 00:50:48.080]   То есть мы будем делать все, что угодно.
    [00:50:48.080 --> 00:50:49.080]   То есть, мы будем делать все, что угодно.
    [00:50:49.080 --> 00:50:50.080]   То есть, мы будем делать все, что угодно.

и на час понёсся повтор одной и той же строчки. Взял наобум другой файл:

    [02:12:14.680 --> 02:12:17.580]   очень активно развиваться.
    [02:12:17.580 --> 02:12:19.580]   Это будет очень активно развиваться.
    [02:12:19.580 --> 02:12:21.580]   И это будет очень активно развиваться.
    [02:12:21.580 --> 02:12:24.580]   И это будет очень активно развиваться.
    [02:12:24.580 --> 02:12:27.580]   И это будет очень активно развиваться.
    [02:12:27.580 --> 02:12:29.580]   Это будет очень активно развиваться.
    [02:12:29.580 --> 02:12:31.580]   Это будет очень активно развиваться.
    [02:12:31.580 --> 02:12:33.580]   Это будет очень активно развиваться.
    [...]

Нашёл багу в трэкере GitHub, где народ жалуется на аналогичное, даже
использует тот же коммит.

Если начать распознавать с seek-ом, то loop не возникает на этих
участках. Короче глаз да глаз нужны.

    [оставить комментарий]