Йотабайты на страже
Jun. 11th, 2013 06:31 pmЧто такой йотабайт? Это 1 000 000 000 000 000 000 000 000 байт. Йотабайт больше привычного большинству терабайта во столько же раз, во столько терабайт больше байта. Кому может понадобиться столько данных? Объем всего интернета пока еще измеряется эксабайтами, и самые большие данные измерялись всего лишь сотнями петабайт. Но американское правительство смотрит дальше, и строит датацентр колоссальной мощности и емкости. Зачем? А потому что ради национальной безопасности приходится обрабатывать десятки петабайт спутниковых снимков в день, десятки петабайт емейлов в день, записывать все звонки внутри США, которые "укладываются" примерно в 20 терабайт в минуту, то есть порядка 30 петабайт в день А еще нужно слушать и записывать радио-эфир и сотовые телефоны вне США, писать трафик на гигабитных роутерах, и уметь подбирать ключи к AES в тех редких случаях, когда пользователи вдруг заходят зашифровать свои емейлы. И все это на самом деле и особо не скрывается. Уже.
Некоторые факты и анализ:
http://www.dbms2.com/2013/06/10/where-things-stand-in-us-government-surveillance
http://www.wired.com/threatlevel/2012/03/ff_nsadatacenter/all/
И напомню презентацию ЦРУ:
http://ushastyi.livejournal.com/166615.html
P.S. В интересное время живем.
Некоторые факты и анализ:
http://www.dbms2.com/2013/06/10/where-things-stand-in-us-government-surveillance
http://www.wired.com/threatlevel/2012/03/ff_nsadatacenter/all/
И напомню презентацию ЦРУ:
http://ushastyi.livejournal.com/166615.html
P.S. В интересное время живем.
no subject
Date: 2013-06-11 03:29 pm (UTC)no subject
Date: 2013-06-11 03:53 pm (UTC)Сам факт редактирования статьи ни о чем хорошем не говорит. Впрочем, Курт Монаш приводит ссылку на статью в Гардиан, а не в WP, что, впрочем почти одно и то же: http://www.guardian.co.uk/world/2013/jun/06/us-tech-giants-nsa-data
В любом случае, для каких целей строится датацентр в Юте не скрывается. В статье с wired много интересных деталей.
no subject
Date: 2013-06-12 06:52 am (UTC)Мне кажется, интерпретировать редактирование статьи как "ага, значит, им угрожали, значит, сначало было правда" - это очень скользкая дорожка. Я допускаю, что глобальные программы по перехвату SSL-трафика существуют, но я не могу принять в качестве доказательства этого - статью, которая через несколько часов после выпуска перестала делать такое заявление. Тем более что даже изначальный текст статьи имел одну из возможных интерпретаций - просто существование портала, через который осуществляется передача данных, без blanket access (это подтверждается уточнённой версией статьи: According to a more precise description contained in a classified NSA inspector general’s report, also obtained by The Post, PRISM allows “collection managers [to send] content tasking instructions directly to equipment installed at company-controlled locations,” rather than directly to company servers).
Это и представляется мне самым вероятным вариантом, хотя и он мне тоже не нравится.
no subject
Date: 2013-06-12 01:58 pm (UTC)Собственно, я не понимаю, что ты возражаешь, если даже сенаторы подтверждают, что это правда, как минимум в отношении глобальной прослушки. “It’s called protecting America.”
http://www.politico.com/story/2013/06/dianne-feinstein-on-nsa-its-called-protecting-america-92340.html
no subject
Date: 2013-06-12 03:07 pm (UTC)Про прослушку я ничего не говорил, и допускаю, что она есть; я говорю именно про интернет-компании.
no subject
Date: 2013-06-11 05:57 pm (UTC)no subject
Date: 2013-06-11 08:21 pm (UTC)Во-первых, если не хранить, то искать нельзя вообще. Поэтому лучше сначала начать сохранять, а уже потом придумать, что с этим делать. Ты же знаешь, что если есть проблема в софте, то логов много не бывает. Обычно они не нужны, но если надо найти поведение одной транзакции или айпишника или сервиса -- то очень даже. А если что-то не логгировать, то потом локти кусаешь. Все эти разговоры и емейлы -- это логи сложной системы "государство" или "мир".
Во-вторых, технологии data mining постоянно совершенствуются, особенно в части predictive learning. Когда я искал реальные применения технологий HTM -- то в основном мне попадались статьи из домена .mil. А для такого рода алгоритмов 1) много данных не бывает; 2) они работают на потоке данных.
То есть, как мне кажется, этот массив данных можно использовать, если нужно узнать что-то о конкретном человеке, и там в статьях есть ссылки на статистику PRISM -- 77 тысяч случаев использования информации из этой системы. Либо же для выявление трендов, аномалий и т.п.
no subject
Date: 2013-06-12 12:29 am (UTC)no subject
Date: 2013-06-12 05:09 am (UTC)