Проблемы с финансированием каталогов пакетов открытого ПО

https://www.opennet.ru/opennews/art.shtml?num=64823
Говорят об огромных финансовых затратах на обслуживание пакетных
репозиториев типа PyPI, NPM, RubyGems, Crates.io, Maven. Миллионы
долларов в год, без учёта миллионных трат которые бы пришлись на
оплату траффика, но всякие Fastly бесплатно предоставляют услуги
для них.

Я помню что когда-то, когда я активно был Python-истом, то размер всего
PyPI был менее терабайта, что-то вообще в районе нескольких сотен гигабайт.
У меня была полная копия. А затем терабайты стал занимать ровно один
пакет: TensorFlow, который выкладывал ночные сбоки для кучи платформ,
сплошь бинари, безумных размеров.

По мне так безумные цифры. Звучит так, что экосистемы всех этих пакетных
менеджеров, devops установки совершенно не заточены под кэширование всего
что скачивают. И я уверен что именно так оно и есть. Не раз слышал ругань
в сторону всяких проектов, что там каждый "make" это скачивание вновь и
вновь одного и того же гигабайтами на каждую сборку. Ну не должно быть
189Gb/sec трафика на PyPI, если бы оттуда скачивались только впервые
устанавливаемые людьми пакеты.

Но основной посыл выступающего: владельцы package repositories не платят
за bandwidth, из-за жертвующих CDN-ов. Деньги нужны на поддержку abuse
report-ов, очистки от malware и всякого такого.

Из-за всего этого я и не люблю саму идею подобных package repositories.
Ну и ужас, когда люди не используют кэши, что приводит к безумию по трафику.

    [оставить комментарий]
    комментарий 0:
    From: "Алексей"
    Date: 2026-02-19 17:46:05Z
    
    > ужас, когда люди не используют кэши
    
    кэширование кэшированию рознь... Вот история из недавнего прошлого, когда
    один "кэш" увеличивал нагрузку на оригинальный сервер:
    
    https://sourcehut.org/blog/2023-01-09-gomodulemirror/
    
    комментарий 1:
    From: Sergey Matveev
    Date: 2026-02-19 19:43:13Z
    
    *** "Алексей" [2026-02-19 16:14]:
    >кэширование кэшированию рознь... Вот история из недавнего прошлого, когда
    >один "кэш" увеличивал нагрузку на оригинальный сервер: [...]
    
    Ну вот правильно написали кэш в кавычках. Для Google он конечно является
    кэшом, а для остальных пользователей -- промежуточным hop-ом, выполняющим
    не только задачи кэширования (из-за чего, собственно, и проблема у sr.ht.
    Лично я то вообще отключаю использование этого Go proxy.