Paspertin Blog
@pigint
Уже больше года я пытаюсь "сесть и сделать" то, что уже давно бы сделал, если бы было финансирование и помощь. Сделаю ещё одну попытку.
Если коротко, я хочу максимально сохранить артефакты и материалы, касающиеся данных россиян. Собрать всё что получится из открытых и полуоткрытых баз. Собрать оригиналы баз а не "перепаковки" и "обогащения". Собрать для будущих осинтеров и расследователей войны РФ против Украины. Конвертировать всю BigBase в csv, что бы и через 50 лет инфа про кредиты и долги, из-за которых "дедушка пошёл на СВО", была в нейроимплантах его внуков.
Это амбициозная цель, и не всё я смогу сделать. Но сделаю многое.
Теперь к сути. В одном из закрытых каналов, где публикуют утечки, приводится оценка в 60 тыс. баз/утечек, касающихся РФ. И там нет оригиналов ЕГРЮЛ/ЕГРИП, официальных "выгрузок" из базы ФССП, реестра недействительных паспортов и даже выгрузок из "ГАС Выборы". Всё это никакие не "утечки данных", а вполне публичные базы. И подобного добра, постепенно пропадающего из паблика, тысячи (гуглите
Та же история со слитыми базами. Оригинал (sql dump) ценнейшей утечки "ЯндексЕда" я смог найти только в торренте с тремя сидами, и качал его неделю. В комментах к этому посту будут ещё примеры как я неделями (!) жду сидов на раздаче торрентов, потому что больше нигде этих утечек/файлов нет. Выпрашивать бесплатно у проукраинских хакеров "сливы" я тоже не могу. У меня в паблике нет некоммерческого проекта, под который можно было бы просить "сливы", а на слово никто в этом "бизнесе" не верит (и правильно делают).
Вобщем смотрите. Все мои наработки "в разобранном виде" сейчас. Приблизительно за месяц и "в одно рыло" я смог бы это довести до рабочей альфы. И у меня есть готовая идея как "спонсор(ы)" этого проекта смог бы кратно отбить вложенные деньги (маркетплейс утечек/сливов и/или продажа не всего привата в одни руки, а данных с него тем же "ботам пробива"). Эта идея уже обсуждалась с разными людьми "в теме" и выдержала их критику. Но по разным причинам не привела к "вложению денег" в этот проект. Один из принципиальных моментов я сразу напишу. "Мои базы" и "мой парсинг" будут для всех и всегда бесплатно. Вплоть до скачивания всего в виде .csv файлов. Так что "пабликом торговать" не получится. Или, другими словами, весь (надеюсь) BigBase будет бесплатно и в виде .csv файлов! Но если у вас есть база "Аэрофлот 2007-2025", то я знаю как можно было бы немного заработать на этом, без передачи всей базы третьим лицам.
В комментах добавлю технических подробностей и буду отвечать на все вопросы от желающих поучаствовать в этом проекте деньгами и/или работой. Там будет много конкретики и технических деталей. Очень хочу критики именно от программистов. И для затравки срача- индексы самописные! ;)
Мне нужно закрыть вопрос с этим видом финансирования проекта (один или несколько крупных спонсоров) до завтрашнего обеда. Если это не сработает, то завтра попробую через донаты ещё. Деньги нужны не только мне "на жизнь", но еще и абузоустройчивый хостинг. И покупку некоторых баз, если никто не подарит просто так ЕГРЮЛ/ЕГРИП на начало 22 года.
Если коротко, я хочу максимально сохранить артефакты и материалы, касающиеся данных россиян. Собрать всё что получится из открытых и полуоткрытых баз. Собрать оригиналы баз а не "перепаковки" и "обогащения". Собрать для будущих осинтеров и расследователей войны РФ против Украины. Конвертировать всю BigBase в csv, что бы и через 50 лет инфа про кредиты и долги, из-за которых "дедушка пошёл на СВО", была в нейроимплантах его внуков.
Это амбициозная цель, и не всё я смогу сделать. Но сделаю многое.
Теперь к сути. В одном из закрытых каналов, где публикуют утечки, приводится оценка в 60 тыс. баз/утечек, касающихся РФ. И там нет оригиналов ЕГРЮЛ/ЕГРИП, официальных "выгрузок" из базы ФССП, реестра недействительных паспортов и даже выгрузок из "ГАС Выборы". Всё это никакие не "утечки данных", а вполне публичные базы. И подобного добра, постепенно пропадающего из паблика, тысячи (гуглите
site:gov.ru inurl:opendata). И если ЕГРЮЛ/ЕГРИП за 22 и 14 года ещё можно купить за деньги, то многое другое уже пропало навсегда. Интернет не всё помнит, как выяснилось. Та же история со слитыми базами. Оригинал (sql dump) ценнейшей утечки "ЯндексЕда" я смог найти только в торренте с тремя сидами, и качал его неделю. В комментах к этому посту будут ещё примеры как я неделями (!) жду сидов на раздаче торрентов, потому что больше нигде этих утечек/файлов нет. Выпрашивать бесплатно у проукраинских хакеров "сливы" я тоже не могу. У меня в паблике нет некоммерческого проекта, под который можно было бы просить "сливы", а на слово никто в этом "бизнесе" не верит (и правильно делают).
Вобщем смотрите. Все мои наработки "в разобранном виде" сейчас. Приблизительно за месяц и "в одно рыло" я смог бы это довести до рабочей альфы. И у меня есть готовая идея как "спонсор(ы)" этого проекта смог бы кратно отбить вложенные деньги (маркетплейс утечек/сливов и/или продажа не всего привата в одни руки, а данных с него тем же "ботам пробива"). Эта идея уже обсуждалась с разными людьми "в теме" и выдержала их критику. Но по разным причинам не привела к "вложению денег" в этот проект. Один из принципиальных моментов я сразу напишу. "Мои базы" и "мой парсинг" будут для всех и всегда бесплатно. Вплоть до скачивания всего в виде .csv файлов. Так что "пабликом торговать" не получится. Или, другими словами, весь (надеюсь) BigBase будет бесплатно и в виде .csv файлов! Но если у вас есть база "Аэрофлот 2007-2025", то я знаю как можно было бы немного заработать на этом, без передачи всей базы третьим лицам.
В комментах добавлю технических подробностей и буду отвечать на все вопросы от желающих поучаствовать в этом проекте деньгами и/или работой. Там будет много конкретики и технических деталей. Очень хочу критики именно от программистов. И для затравки срача- индексы самописные! ;)
Мне нужно закрыть вопрос с этим видом финансирования проекта (один или несколько крупных спонсоров) до завтрашнего обеда. Если это не сработает, то завтра попробую через донаты ещё. Деньги нужны не только мне "на жизнь", но еще и абузоустройчивый хостинг. И покупку некоторых баз, если никто не подарит просто так ЕГРЮЛ/ЕГРИП на начало 22 года.
👍 6
🔥 3
45 12 1.1K
Обсуждение 45
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram