Събота, Януари 29, 2011

Wikileaks vs Facebook

Сряда, Януари 26, 2011

Моля чувствайте се у дома си :)

Неделя, Януари 23, 2011

А аз може и да си взема една година

Представители на ресторанти и хотели отишли при Борисов да лобират пълната забрана на пушенето да се отлага до последно, в стил опълчението на Шипка, че и отгоре, щото у Европата, па дори и у Балкански полуостров друга държава без такава (или определена най-скорошна дата за това) не остана. Целта е ние да се превърнем в един пушком (за тези, които си спомнят от училище) на ЕС, и след секс, алкохолният и наркотичният, да развием и един европейски тютюнов туризъм. А доводите разбира се, народни, интерпретирайки, често на обратно статистиката на другите държави от ЕС - загуба на работни места и данъци от дългосрочно падане на потреблението, щото пушачите като решат, и няма да ходят на ресторанти и хотели до живот. Спомням си как ние в беге та чак до 80-те години пазехме парните влакове на места (а аз знам, защото живяхме на гарата), най-вероятно заради работни места. Колко много познати на дядо ми (той началник гара, те предимно огняри) умряха от рак на белият дроб и кашляха сажди (истински), и незнайно защо все свъзрвам пушенето в България, с опушените от парните влакове гари. Не че ми дреме чак толкова много, всеки сам живота си поврежда, но не мога да не остана потресен от думите на премиера, любезно предадени от цигарозастъпниците и препечатани тук - "... и една година отгоре от мене". Спомням си сцена от филма "Опасен чар" където измамникът игран от Тодор Колев лепеше банкноти на стриптизиорките (кабаретки) и им викаше "Това от мене". Какъвто и да е Борисов, той не е никой за да дава години, на който и да е. Това може да се гласува от парламента, от моите представители, за които уж аз съм гласувал. И ако някой, си присвоява правото от мое име да дава години на тоя или оня, без значение дали е за напъването до последният възможен срок и ден, та и плюс един час отгоре, на отлагането на една такава забрана (съгласно споразумение с ЕК), то знае ли човек, може аз да си взема обратно годините, дето съм му ги дал да ме представлява. 

Петък, Януари 21, 2011

Най новият виц по повод Тановхейт

Бях пуснал една колекция с лафове по повод подслушването ето тук. То пък се оказа, че умишлено в над 1/3 от случаите МВР и прокуратурата използвали вратички в закона за да избягват съдебният контрол през последните няколко месеца съгласно изследване на ПДИ публикувано тук. Отделно парламентарната комисия за контрол на СРС пък не може да извършва ефективен контрол, да не кажа никакъв контрол, съгласно мнението на прависти публикувано тук.
Но да се върнем към вица - днес ми казаха още един:
Казали му на Борисов, че ако отидел на преход в планината щял да намери отговор на всичките си душевни терзания. Качил се той и на една урва се спрял и се провикнал с все сили "Коооой идиооот подслуша Тааанов?", а ехото му отговорило "Цветааанов... тааанов... тааанов..."

Четвъртък, Януари 20, 2011

Как точно трябва да се изследват Тановгейт записите за да се види дали има подправяне

Тук ще опиша логиката и алгоритъма, по който трябва да се изследват записите, за да може да се докаже бързо и лесно дали има подправяне. Смея да твърдя, че е изключително възможно всичките тези операции да могат да се извършат от оторизирани лица за един час, и в рамките на един час да се знае истината. Много е възможно това вече да е и сторено, но публиката да е спасена от резултатите, или те да са класифицирана информация.

С какво разполагат оторизираните лица -
  • Записите на Танов разпространявани в Интернет или от в. Галерия, които са маркирани по поредност, кой на кого е звънял и време когато са се случили.
  • Трафичните данни за тези записи налични в мобилните оператори, които определят дали съответните обаждания са се случили, по какъв път са минали (вкл. дали и през оборудването на СДОТО/МВР) и каква е била тяхната продължителност
  • Контролни записи от същите СРС-та предадени на прокуратурата (те не са задължени да се унищожат в срок) или от други СРС-та (всеки запис може да послужи за контролен, не е задължиетелно да е на Танов)
  • Регистрите на записаните СРС разговори (до които има достъп комисията за контрол на СРС от парламента, а вероятно и прокуратурата), които са задължителни по закон, които съдържат време, продължителност, кой е записан, какво е последвало. Тези регистри/логове вероятно съдържат и информация за това кой е имал достъп до тези СРС-та
Това което се наблюдава от записите и е очевидно е:
  • Записите са презаписани с устройство със стерео микрофон, като единият микрофон е чувал доста по слабо звука (което между другото не е лошо за анализа) през аналогов път. Телефоните и компютрите имат моно микрофони, така че най-вероятно става въпрос за диктофон сложен в близост до слушалка. Стерео микрофоните са доста близко разположени един до друг на всяко устройство и четири пъти по ниската мощност на левия канал е добър индикатор за направеният до момента извод. Чуват се и странични звуци, но е важно да се отбележи, че вторичният фонов шум е тих и средата е била тиха.
  • Всеки един запис съдържа бипове на 3250 hz на точно 2.5с отстояние, започващи с подслушаният запис и завършващи с него, обаче имайки паузи преди и в края на записите на в. Галерия, индикиращ, че този звук е от оригиналният запис. Тези бипове също така се чуват в идеалната си пропорция (като останалият звук) на левият и десният стерео канал, следователно е 100% сигурно, че те са налични в оригиналният запис и не са добавяни впоследствие. 
  • Средната мощност на двата фонови шума, и на оригиналният и на добавеният, са еднакви и логични в цялостността на на целите разговори
  • Гласовият канал се отваря от позвъняващата страна и се чуват разговори и шум още преди отсрещната страна да е вдигнала. Това се наблюдава във всички случаи, без значение каква е посоката на разговора (дали Танов се обажда или му се обаждат) и къде е било физическото местоположение на всички говорили (и то в доста кратък интервал от около 2 часа).
  • Силата на звука на двамата говорещи е еднаква, нормализирана, и не е по-голяма в полза на този, който е набрал. Отделно не се наблюдават кънтене, халф дуплекс комуникация (когато единия говори звукът на другия да заглъхва) и т.н.
Всичко това са абсолютно достатъчни следи, за да се постигне 100% достоверност на едно цялостно изследване, буквално в рамките на един час.

А именно -
  1. Поведението на гласовият канал индикира следното - тези записи не са направени от частна структура с оборудване за подслушване в телефонен апарат, или подслушване на радио канала било то поединично или Wideband. Всички тези техники биха изискали подслушване в непосредсвена близост до подслушваният субект, който инициира обаждането. Микрофон, добавено устройство към телефона, сменен firmware, софтуер на телефона биха създали не нормализиран звук и звукови дефекти. Нормализираният звук и липсата на дефекти доказва тяхната липса. Липсата на ехо и халф дуплекс допълнително изолира и laud speaker phone опцията. Радио подслушването изисква непосредствена близост до 3 (ако не и 4) субекта (един от които - Борисов, се е намирал в кръчма), едновременно и то точно в този физически момент на тези разговори, и това напълно обезсмисля тази хипотеза. Отделно техниките за радио подслушване работят почти изключително за 2G и няма сигурност, че телефоните няма да се закачат на 3G (форсирането им има и други проблеми) . Безспорно е, че подслушването е станало в мрежата на мобилните оператори.
  2. Регистрите на СРС и отделно трафичните данни трябва да могат моменталически да потвърдят дали тези разговори са били осъществени. Дали продължителността им е еднаква със записите в Интернет. Дали регистъра на СРС и трафичните данни съдържат една и съща информация. Дали разговора е копиран на оборудването на СДОТО. Тази проверка ще докаже окончателно дали подслушването е извършено от МВР или от трето лице в мобилният оператор. Смея да отбележа, че модификацията на сигнализацията в MSC-то (централата) на мобилният оператор, така че да може да може да се осъществи подслушване е комплексна. Малко са хората и оборудванията които могат да го направят, и са ограничени от физически достъп, контрол и необходими познания за вътрешната структура на оператора и машршрутизацията на сигнализацията. Слагането на такова оборудване там, с предварително знание кои са телефоните които искаме да подслушваме (Танов), което на всичко отгоре да засече такива разговори моменталически и после да се изнесе тайно, е хипотеза от филм Мисия Невъзможна. Косвените индикатори, че Танов е знаел за подслушването си, че е имало заявка за СРС, и т.н. и особено вчеращното изявление на Комисията за контрол на СРС просто затвърждават на 100% хипотезата, че записите са от оборудването на СДОТО и МВР, събрани от мобилната мрежа на оператора
  3. Трябва обяснение на произхода на биповете. След като знаем, че записите са станали от оборудване на СДОТО, и знаем, че има (по твърдение на производителите на такова оборудване по интернет) индустриален стандарт за слагането им с цел да се премахнат възможностите за манипулация, можем да предположим с изключително висока вероятност за истина, че те са сложени от това оборудване. Това може да се засече с писмо до производителят на оборудването. Но по лесното и бързото е да се засече с контролен разговор. Идеално би било ако (както твърди Комисията за контрол на СРС от вчера) част от тези разговори са били предадени на прокуратурата, и те ги имат в оригинал. Но дори и да са унищожени (както прокуратурата пък се оправдава днес) това не е проблем. Каквото и да е друго СРС идващо от СДОТО би имало или нямало тези бипове. Ако ги има (каквато вероятност граничи до 100%) те просто се центрират по старт между контролният разговор и проверяваният и се проследява тяхната последователност. Прокуратурата безспорно има отговор на този въпрос с биповете и го е имала още на десетата секунда на споменаването им. Просто е нямало начин да не са чували друг път СРС, а това би си проличало веднага. Любопитно предположение е, че тези бипове вероятно са слагани и на входящият и на изходящият звуков канал. При смесването им, при различни дефекти, би трябвало да има размазване в наслагването, ако е имало модификация, манипулация или проблем с единият или другият звуков канал. Биповете обаче са идеално позиционирани. Тоест или е работено със записи без тях (и те са слагани в последствие, но преди повторното копиране), или няма модификации. Дори най-добрите филтрации биха оставят нарушения.
  4. Имаме три разговора, в които три лица говорят едно и също обвинително нещо. За да има подправяне, то трябва да е и на трите разговора едновременно, около обвинителните фрази. Там не се наблюдават никакви индикатори за това. Но дори и да приемем че е имало идеално подправяне, то е трябвало подправящият да разполага с часове, буквално студиини записи разговори и на трите субекта.
Следователно, ако имаме бипове в оригиналните разговори от преди вторичният презапис (очевидно и лесно доказуемо), регистрите на СРС и трафични данни показват еднаква дължина на записа, и тя е дължината на записите пуснати по Интернет, добавяйки и липсата на всякакви други индикатори за презапис остава единствената възможна хипотеза записите да са оригинални.
Тъй като за да не са, трябва някой да е имал достъп до записите преди биповете (тези хора ако въобще съществуват са по малко от половината пръсти на едната ми ръка), да ги е извадил, да ги е модифицирал разполагайки с часове записи на трите субекта, правейки перфектният монтаж, дето не само да не се открива но и да не променя дължината на записа (някой трябва да има безрезревна вяра и любов към съветските учени, за да си мисли, че те са способни да го направят за да помогнат на "комунистите"). После е трябвало да върне записите в оборудването, за да си сложи то биповете по маска и алгоритъм. После е трябвало да си ги плейне на диктофон, а после да ги прикрие като доказателство (вместо да ги даде на прокуратурата и да стане скандал още тогава), приемайки че малко вероятно другите оператори и прокуратурата едновременно да искат да ги прикрият. Тази хипотеза е толкова ограничена до хора, които могат да я извършат (вероятно нула) и е толкова невероятна, че просто не може да се разгледа като реална. А хората с такива възможности биха използвали други, по прости и по ефективни техники да направят скандал.

Ако оборуднването на СДОТО не оставя маркери (което би било колосална грешка), то манипулациите са възможни и хипотезите ще завият в други посоки. За това и отговора на въпроса с маркерите е ключов (и пропускан от официалните експертизи за сега).

Проследяването на посочените стъпки е достатъчно за да определи при това много бързо дали е имало монтажи или не.

При неотговаряне на някоя от стъпките, има ясни и конкретни допълнителни контролни проверки, които могат да се направят.

Допълнителни техники като проследяване на вдишването издишването и тоновете, контроли по фоновият шум, ENF и остатъци от канцелаторите само могат да затвърдят това, но са бавни, а и безсмислени при наличие на отговор (от контролен запис) за биповете и трафичните данни.
Както споменах, всичко това може да се разбере за един час. И аз предполагам, че вече може би се и знае. Въпросът е дали и ние ще го научим.

А отделно от всичко тези скандали показват че:
  • СРС записи се изнасят, следователно контролът върху тях е слаб
  • СРС се прикрива (поради липсата на постоянен контрол и контрол само за започването им) и така се "загубват" ценни записи
  • Изпада информация до подслушваните, за това че са подслушвани (виж разговорите на Танов)
  • Прокуратурата и медиите са склонни да вадят изводи върху недовършени експертизи, които на всичко отгоре казват друго нещо

Сряда, Януари 19, 2011

Експертизата на прокуратурата се отказа на първа стъпка

В анализите на записите на Танов, които правихме с различни граждани по Интернет, ние анализирахме доста хипотези. Първото видимо нещо е, че презаписа е направен на диктофон/подобно устройство по аналогов път. Това е очевидно доказателство, че записите не са "оригинални", но също така не е доказателство за това, че те са подправени. Анализа на прокуратурата е просто потресаващ (можете да го прочетете ето тук) - http://www.dnevnik.bg/bulgaria/2011/01/19/1027861_ekspertizata_zapisite_sa_manipulirani/
Той казва следните две неща:

  • има 4khz записи от телефонна линия, върху вторичен презапис 16khz - значи не са оригинални (топлата вода)
  • намираме стилистични несъответствия (тоест Борисов не говори на литературен български) значи са подправени - ?????!?!?!?
Техният анализ не споменава нищо за СРС маркерите.
Не казва как може да се направи подправяне така, че оригиналният фонов шум (вторичният фонов шум може да се изфилтрира и не афектира оригиналният) да е винаги еднакъв и с еднаква мощност.
Не обяснява как няма индикатори за снаждане.
Не обяснява защо СРС маркерите не са нарушени, а е веднага видимо дори за такива експерти, че те не са сложени там при вторичният презапис.
Не обяснява важният въпрос - оригиналният произход СРС ли е или не, тъй като ако е СРС, това доказва, че почти 100% сигурно е, че маркерите са били изначално там, а като следствие значително улеснява изследването за подправяне (което има съвсем друг извод от изказаният от "експертите" на прокуратурата), имайки се в предвид, че логика на маркерите, цялост и последователност не са нарушени никъде.

Не се дава и обяснение на другите преки и косвени доказателства за липсата на подправяне (които сме изложили или експериментираме).

И макар прокуратурата днес да призна официално, че това са СРС-та (ама били законни, а не незаконни), в експертизата не се анализират никакви изводи последвали от това. Нито е казано дали продължителността на разговорите е същата, като отбелязаната в трафичните данни (добър индикатор за подправяне, който в момента сякаш е колосална държавна тайна).

Аз казвам следното -
Нека СРС-тата бъдат декласифицирани и да бъдат дадени за сериозна експертиза от независима лаборатория (докато са класифицирани не могат), може и в чужбина.
Нека експертизата на експертите бъде цялостно публикувана и да подлежи на обществени въпроси и дискусия. Тъй като изказаното в медиите е просто смешно.

А до тогава, на нашата група работила по тези записи, мнението си остава това, което е публикувано тук - http://www.mediapool.bg/show/?storyid=174942&srcpos=8

Между впрочем нови техники за проверяване на валидността на записа измисляме всеки ден (виж предишните ми постове). Днес намерихме и още една нова. А на изводите от експертите на прокуратурата ще кажа - много слабо, много слабо, много слабо, лошо Седларов, лошо.

Нека да публикуват точките, където те мислят, че може да има снаждане във всеки разговор, за да видим и ние. И дали тези точки съвпадат променяйки едновременно смисъла и на 3-те контролни разговора - Танов-Борисов, Танов-Дянков, Танов-Странджев. Тъй като ако твърдението е, че има подправяне, тъй като и трите разговора носят един и същи смисъл (един и същи текст изказан от три лица едно на друго - за това какво бил обещал Борисов), подправянето трябва да е и в трите на едно и също място (иначе защо Танов ще си измисля същия текст в другият разговор, дето Борисов не му го е казал). Тези 3 разговора могат по отделно да се засекат контролно за подправяне. Ако има, то трябва да е на едни и същи ключови места, което трябва да е много лесно доказуемо. Ако не е на едни и същи ключови места, няма как да съществува. Ако и на трите разговора дължината съвпада с описаната в трафичните данни, подправяне няма изпълним начин как и да има.

Не мога да разбера как експертите на прокуратурата да са видяли нещо, което ние не можем, и то при условие, че трябва да е очевидно в засечката на всичките тези разговори. Понеже ако са видяли нещо на друго място, то не променя смисъла на разговора по същество, нали се сещате :)

Така че аз искам граждански достъп до експертизата на експертите. И искам да им задам 2-3 въпроса.

Междувременно, въпреки супер слабата експертиза на експертите, поне по написаното в медиите, която дава такива твърди изводи, върху такива слаби твърдения, нашата неформална и не познаваща се група (при bivol) продължава да работи върху далеч по-сериозни методи, които установяват дали е имало подправяне или не.

П.С.
Според прочели експертизата (скоро надявам се и аз) тя не отхвърля хипотезата, че записите не са монтирани, само казва, че не са оригинални. Други експертизи тепърва следвали (неща, които ние вече сме правили).

Покай се и ехото ще те освободи!

Не съм в България, но това не ми пречи да се занимавам с български дела. Както споменах в предният пост, група ентусиасти разсъждаваме по Интернет върху записите, и търсим следи дали са истински, подправени, дали са СРС от МВР или някой тайно, но с невероятни познания, физически достъп и възможности да преконфигурира тайно мрежите на мобилните оператори е събрал тази информация, но при всичките си тези възможности, па идиот си оставил бипове, за да не може после лесно да си я реже и манипулира.

И в процеса на разсъжденията се роди тази идея, вероятно широко ползвана от аналитичните лаборатории върху цифровите телефонни записи, но нова за нас ентусиастите. Нова, нова, може да се окаже относително не прекалено трудна за реализиране, стига да се доберем до определен соурс код, не струващ чак толкова много пари, а може би дори и безплатен.

Идеята е базирана на следното -
Във всяка цифрова телефонна мрежа (и това включва мобилните) има ехо канцелейшън (echo cancelling) иначе често, особено в мобилните мрежи (мрежи с голямо закъснение) ще чувате своят глас ("това е твоят глас" - новият девиз на МВР).

Логиката е проста, канцелатора следи звука, който изпраща на out, сравнява го с този който идва на in, и ако има съвпадение на вълната, я събира с тази изпратена на out но обърната на 180 градуса, и така се маха входящото ехо. Това е най-просто обяснено, защото все пак трябва да се изравнят и мощностите.

Такива канцелатори се намират в телефонните апарати и на местата на преобрзуването на сигнала, понякога там където се транскодира на сигнала, често на границите с външни мрежи, и на всякъде където има цифрово-аналогово преобразувание. Канцелатори може да има и на други точки в мрежата, ако вътрешните закъснения са големи, с цел да се държат буферите малки (и устройствата по прости и евтини), в по-сложните мрежи.

Отделно когато човек говори в затворено помещение, стените отразяват гласа му, и се появява специфично кънтене (в едната посока), понякога доста изместено, на което не му обръщаме внимание, но си е там.

Кънтенето и ехото, дори и опитвани да се махат от канцелатори, не се премахват идеално. Защото не може да се намери идеално попадение, а и средната мощност не може да се измери коректно. Като резултат ехото не се премахва наистина, то се променя и намалява, превръщайки се в тих шум, който ние естествено игнорираме, но който е наличен в записите.

Проблемът тук е AAC или MP3 кодирането, което може да замаже този шум като не важен за ухото. Но ако имаме достъп до по-оригиналните записи (а не тези в интенет), и премахвайки ехото дошло от презаписа с диктофон (което може да се изчисли и евентално игнорира) ще имаме една много добра следа от ехото от телефонната мрежа.
Хубавото на това ехо, е че то е изместено няколко десетки милисекунди и представлява отражение на отсрещната вълна в обратна посока (дали инвертнато при канцелиране или не, ако няма кацелатор). То би било изключително силен индикатор дали има миксиране на фонеми, тъй като не може да се симулира лесно, трудно е за досещане, нормалните ехо филтри добавят ехо в същата посока, но не и в обратната, и за това нашето ехо е изключително специфично. Това че е отместено пък ще е индикатор за това дали тази фонема или парче от звук трябва да е тук или на друго място (сравнявайки я като пъзел с насрещният звук). Ако това ехо въобще не се вижда, значи пък е изрично филтрирано с high-pass filter, което е индикатор за монтаж.
Смятам че това е толкова очевидна техника, че най-вероятно откриваме тук топлата вода на лабораториите за анализ на телефонни записи срещу монтаж. При все обстоятелства откриването на проблемни зони не би трябвало да е труден проблем с такава техника - взимаме код за типична ехо канцелация, използваме алгоритъма му за търсене, но с инвертната вълна на 180 градуса и търсим попадения. След като намерим (тъй като това телекомско ехо се запазва със стабилно отместване като закъснение в много голям интервал) попадение, почваме да проверяваме какво има на мястото където трябва да е ехото при всички фонеми. Там където не го намерим, ще е индикатор за монтаж. Ако го намерим на повечето/всички ключови места, то монтаж няма.

Въпреки че до сега не можем да намерим принзипно индикатори за монтаж в записите на Танов, тази техника би била един допълнителен, много силен и доста трудно замазваем, индикатор за наличието или не наличието на такъв.
Аз специално вярвам, че реализацията на трасирането не трябва да е трудна (взимайки подходящ код от астериск или openser). Отделно смятам, че всяка себеуважаваща се лаборатория вероятно разполага с подобен софтуер за анализ.

Тази техника може с изключителна достоверност при относително качествени записи да определи дали е имало монтажи на ново фонеми, дори и направени от много добри професионалисти, заради това, че ехото е често изместено с около една фонема разстояние а пъзеловата комбинация става толкова сложна, че е практически нерешима от монтажист. Обаче тя не може да докаже дали е имало монтажи на ниво дълги фрази и веднага след големи паузи. Тези монтажи обаче би трябвало да могат да се изчистят или докажат през други техники за анализ. Отделно монтажите на дълги фрази са много по трудни за напасване и биха променили и дължината на записа. Това от своя страна моменталически може да се засече през трафичните данни от мобилният оператор (разлика във времето на записа и това което централата е отбелязала в трафичният лог, че наистина е траело), заради което както споменах тези трафични данни продължават да бъдат от изключителна важност за едно такова разследване.

Вторник, Януари 18, 2011

Crowdsourcing по записите на Танов

Много хора, може би към 20 души, без с нито един от тях някога да сме се виждали на живо, обсъждахме в последните дни техническите възможности как СРС-тата на Танов са могли да бъдат направени, както и анализирахме самите записи, ровихме се из интернет, проверявахме патенти, създавахме алгоритми за излвичане на маркери. Аз специално до сега не бях участвал в Crowdsourcing и съм впечатлен колко ефективна може да бъде, когато участващите хора в нея са сериозни, и са отворени да обсъждат произволни хипотези, запазвайки ги или отказвайки ги, на базата на логика, вероятности и технически доказателства. Мотивът бе едно чисто техническо упражнение на ума и разработване на хипотези по изпадналите в публичното пространство записи на разговори на Танов. Писанието ми тук е с цел само да отбележи моето впечатление от такъв тип работа, и това, че то е индикатор, че публиката в България е все пак в позиция да прави разумни анализи по изтеклата информация, и това всъщност на кого да вярваш е въпрос на лично желание в много по-голяма степен, отколкото поради липсата на факти. Както вица казваше - "Докторе, едно виждам друго чувам?" "-А-а-а, от социализъм не лекуваме". Да си намериш сам някакви факти, но да вярваш, че тях ги няма, е един вид шизофрения. Не е като да не се е случвало да ми се е случвало. Колко ми се искаше да засека монтажи и рязания, десетки пъти да сме гледали и мерили, но няма сериозни индикатори за това. Не ми се иска правителството да падне, особено сега. Но това няма никакво техническо значение за наблюдаемите факти по записите. Най-силната към момента и най-трудно оборима от доказателства хипотеза към момента е, че записите са автентични и са събрани с оборудването на МВР. Не че не ми се иска друго. Но няма други доказателства и индикатори. Разбира се обсъжданията и изследванията продължават. Възнамерявам дори да тествам алгоритъма изследващ остатъците от ехо канцелаторите и транскодингите от чисто любопитство. Разработката му може да ми отнеме седмици, но може да се отплати с вероятност да мога да определя мобилен оператор, тип подслушване, евентуално местоположение, медия контрол на сигнализацията, да се видят маркери от подслушващото оборудване и евентуално неговият тип. Ако разбира се истината излезе преди това, може и да се откажа да си губя времето, но все пак това си е един вид техническо предизвикателство, което може да се отплати на по късен етап. Единственият проблем е, че опита ми в тази математика и звуковите технологии е скромен, но както се оказа приятели, с познания, готови да помагат има много.
Ако желаете да видите изводите към текущият момент, можете да прочетете писанието на Атанас Чобанов, в което и аз имам своят малък дял, както и още доста хора, ето тук: http://bit.ly/hjweRg

Неделя, Януари 16, 2011

Може ли да се установи дали СРС-тата на Танов са минали през GSM мрежата на оператор?

След една дискусия, инициирана от скандалите за СРС-та се отвори една интересна тема - дали има механизъм за лесно установяване за това, дали СРС записите са записани от оборудване на МВР или от друго място. Въпреки че министър Цветанов веднага се опита да прехвърли вината на мобилните оператори, косвените показатели, че става въпрос за издънки някъде в службите за момента са драматично преобладаващи (включително факта, че Танов е знаел, че е подслушван). Обаче започнаха да се появяват и твърдения, че може записите да са направени с външни устройства, имайки се в предвид, че се чуват звуци от преди звъненето в новите записи. Аз обаче смятам, че това не може да е показател, тъй като по това те се различават от първите записи, и може вторите да са обработени нарочно, поради изказването на прокуратурата, че техните "експерти" казват, че щом записа е цифров, нямало начин да не се установил първоизточник. Аз първосигнално след такова изказване, бих прекарал записа през аналогов спиикър-микрофон, и подозирам, че подобно поведение е имал и "заинтересованият гражданин" на Явор Дачков, ако разбира се приемем, че това не е второто му аз. Други причини също съществуват, особено ако комуникацията е 2G (там звуковият канал се изгражда преди вдигането на отсрещната страна, но това би било изключителен индикатор за оборудване участващо в SS7 сигнализацията на оператора и имащо достъп дори до media-announce съобщенията - почти 100% индикатор за произход от оборудването на МВР). 
Та появи се дискусията, дали не може все пак въпреки този презапис да е останала неоспорима следа, от това дали записа е правен през мобилната мрежа на оператора (и следователно най-вероятно от оборудването на МВР) или от софтуер на телефона или от външно оборудване до подслушваният субект.
Моята теза е, че всъщност установяването на това може да се окаже удивително изпълнимо, по наличните в интернет презаписи, въпреки всички транскодинги, които им са се случили и дори прекарването им през аналогов микрофон. Нещо повече, с провеждането на експеримент е вероятно възможно и да се установи дали тази мрежа е била на Мобилтел, Глобул или Вивател.
Ето на какво е базирано моето предположение -
Ако записа е правен със софтуер на телефон или с устройство с микрофон в близост до Танов, едната от страните (Танов) трябва да се чува по естествено, честотната лента на разговора в посоката трябва да е по-динамична, средната мощност на звука по-голяма и това може веднага да се установи на честотната диаграма на записа. Ако е минало през мобилната мрежа, двете страни ще са относително нормализирани и това също би било лесно видимо на диаграмата.

Но аз имам и друго в предвид. Мобилните мрежи използват кодеци, които не са особено популярни в реалният живот и не се ползват от диктофони и друго оборудване. Причината за това е, че съотношението им на процесорни цикли/bandwidth е обикновено лошо. В мобилната мрежа цената на процесорните цикли обаче се пренебрегва в полза на bandwidth-а, докато при други приложения се търсят други съотношения.
Кодеците са GSM.13 за 2G и AMR 12.10 (AMR-NB) за 3G.
Разбира се, не искам да кажа, че записите по флашките на Дачков са с оригиналните си кодеци. Това би било глупаво. Отделно че дори в самата мобилна мрежа се извършва транскодинг от access codec-а към G.711alaw. Записите в Интернет вероятно са допълнително транкодвани при слагането им в VBOX7 например.

Но моята теза е, че всеки кодек и транскодинг остава следа, от която могат да се създадат маркери, по които този кодек да се открие. И въпреки транскодингите и преминавания през аналогови презаписи, тези маркери могат да бъдат открити в голяма степен. Нещо повече, подобни маркери оставят и echo cancellation устройствата, маркери, които се натрупват и по тях индикативно може да се установи къде спрямо структурата на мобилният оператор е извършено подслушването (тъй като в мрежите може да има няколко канцелатора и транскодинга). По това може да се установи с различна степен на достоверност дали е записа правен през мобилен оператор, кой евентуално оператор, позиция, и по този начин вероятно индикативно да покаже, дали записа е правен с оборудването на МВР.

За направата на този анализ е необходим евентуално по-качествен запис от говора на Танов, за да служи като контролен. Но това не е проблем. Може да се вземе от телевизор, директно интервю или друго.

Тезата е базирана на следната идея -
Начина на кодиране на цифров звук е комбинация от честотно модулиране (sampling), запис на мощността на звука, и добавени филтрации/преобразувания с цел премахване на излишъка. Така се намалява количеството записвана информация. Премахваната информация променя звука, но често това става по незабележим за човек начин (честоти или звукови комбинации, които не се чуват, намаляване на разделителната способност на мощността на звука и т.н.).

Но техниката на всеки кодек е доста различна (освен при кодеците от един и същи род). Например G.711 намалява най-вече разделителната способност на мощността на звука, но има фиксиран линеен самплинг от 8khz. Други кодеци заглаждат звуци, намаляват и разделителната способност на самплингите динамично или статично (G.729), допълнително намаляване на динамиката на мощността. 

При транскодинг от един кодек на друг тези техники не изчезват а се наслагват. Така както бихте наслагали една рисунка върху друга. В резултат специфичните маркери на даден кодек могат да се запазят, особено в по продължителни записи и да се открият.

Echo cancellation техниките използвани в мобилните мрежи също имат специфична характеристика. Тя е лесно уловима - вълната от едната посока се вижда инвертната от време на време в другата. Може да има изместване и наслагване на такива инвертвания, показател за повече от един канцелатор. Новите канцелатори пускат и бипове на някой специфични честоти (нечуваеми за човек), например 2100hz, за да замерват закъснения. Те също се наслагват.

Не съм звуков специалист определено, но мога да опиша алгоритъм по който да се установи дали такива маркери съществуват -
Взима се добър запис на Танов (по широка честотна лента, да речем 16khz), изчиства се шум (с low и high pass филтри над 8khz), нормализира се и се конвертира (със sox) до G.711alaw, AMR и GSM.13.
След това се правят следните конверсии - AMR->g.711а и GSM.13->g.711а.
Получените резултати се наслагват върху първата g.711 и се прави изключващо или. Там където мощностите съвпадат се слага черно, където се различават - бяло (за разликата).
Белият цвят ще бъде честотният спектър изрязан от GSM.13 и AMR. Това е маркера, който ще се търси (по изрязване) в записите на Танов (предварително нормализирани и с изчистен шум - noise cancellation филтър приложен) за индикиране, дали тези кодеци са присъствали по време на записа. Ако предимно (на определени думи или комбинация гласна-съгласна, да речем срички)  този маркер липсва, то имаме доказателство за присъствието на този кодек в пътя на транскодинга. Ако този маркер предимно присъства, значи този кодек не го е имало.

Подобна операция се извършва и по динамиката на мощностите на звука (може да се ползват различни цветове при нарастването на мощността - като дъга, за да може отново да се види визуално).

Комбинацията - маркери за филтър + маркери за динамика за мощност, могат според мен с изключителна достоверност да определят дали кодека е присъствал.

Подобна, но макар и по компексна, техника може да се приложи за ехо канцелаторите. Тъй като core дизайна на мрежата на всеки оператор у нас се различава, това би могло индикативно да определи кой е оператора, къде е било подслушвателното оборудване (преди или след някой канцелатори), какво е било закъснението при което канцелаторите са филтрирали ехото, което би дало допълнителни индикации, които могат да покажат къде и как се е движил звуковият сигнал.

Всичката тази занимавка е просто тренировка на ума. Но дава механизъм на публиката да оцени колко я мотаят с публични изяви прокуратурата, министрите и т.н. и дали това, което говорят е вярно. Ако разполагате с Линукс и Audacity + sox и качествен запис на гласа на Танов, и свободно време, можете да тествате алгоритъма.

При все обстоятелства, трафичните данни биха дали относително безусловно доказателство дали е ползвано оборудването на МВР или не. Но това, която аз предлагам е индикативен механизъм, който може да го покаже и на базата само на информация налична в момента публично.

Ще ми бъде интересно да сравня резултатите от експертизата, която според мен може би се бави нарочно (може би за да паднат по давност трафичните данни?) и да го сравня със собствените си изводи.

П.С. Смятам че тази техника за откриване на пътя на разговора може да се усложни дори повече (от специалисти) и дори да може да разпознава групи от модели мобилни телефони използвани в разговора. Тъй като всеки мобилен телефон има различна комбинация от отстояние между спиикър и микрофон, има различен тип микрофон и спиикър, и различен софтуер, често с локален ехо канцелатор, то той би имал специфични характеристики видими в звуковата диаграма на аудио записите. Записи от външно оборудване няма да ги имат включени тези характеристики. Но ако записът е от мобилната мрежа, ще ги има.

Събота, Януари 15, 2011

Цветанов обвинява мобилните оператори

Според изказването на Цветанов излъчено по БТВ, той намеква, че частни структури може да са направили записите на Танов и може и да няма издънки в МВР.
Не че е невъзможно, но е изключително малко вероятно.

Ето какво казва Цветанов - 
„Да, в България всички използвани СРС-та са с разрешение на съдия и това, което е важно - дали тези записи, които се тиражират са нерегламентирани и са от частни институции. Кажете ми как и по какъв начин се контролират мобилните оператори в България?”, коментира Цветан Цветанов.

Тъй като Цветанов има тази теза от поне една година, е редно да го запозная със законодателството в България.
Мобилните оператори са под контрол на следното законодателство, третиращо личната информация (което включва трафичните данни, подслушаните разговори, достъп до информацията) - ЗЕС (закон за електронните съобщения), ЗСРС (закон за специалните разузнавателни средства), ЗДКИ (Закон за достъп до класифицираната информация), НПК, Конституцията (тъй като службите не попадат директно под контрола на правото на частен живот, но мобилните оператори попадат), Лицензните си споразумения и от тях от КРС.
За сметка на това служители на ДОТО/ДОТИ, МВР, ДАНС имат доста висока степен на независимост и надзаконие, освен в изключителни случаи, доказани единствено от Комисията за контрол на СРС към Парламента (тоест политически контрол) или Комисията за контрол на личните данни (която все още не оперира по промените от ЗСРС). В този смисъл мобилните оператори са заплашени да си загубят дори лицензите (а лица са заплашени директно от затвор) и следователно заинтересовани това да не се допусне. Служителите на ДОТО са заплашени единствено въз основа на вътрешните процедури и евентуално от затвор. Отделно прокуратурата не може да използва СРС или трафичните данни за разследване на злоупотребите в повечето казуси, и специално във всички случаи по ЗЕС, тъй като законът не определя (и то след мощен натиск от страна на МВР) извършеното престъпление като тежко.

Извършването на подобно подслушване не е много лесно. То изисква специализирана техника, разположена и постоянно намираща се в непосредствена близост до подслушваният обект (което няма как да обясни записите разпръснати в голям интервал от време на Танов, тъй като няма как съответните хора да останат незабелязани, а откриването им би било много лесно). Или изисква модифициран телефон (смартфон или модифициран firmware), което много лесно се открива и доказва.
Подслушването от страна на мобилният оператор изисква специална преконфигурация  в HLR-а (тъй като подслушваният може да е в движение и просто няма как да се подслушват всички BSC-та), която установява 3-way conferencing или премаршрутизира обаждането през подходящо устройство. Не са много местата където такова устройство може да се сложи, тези устройства не са случайни. Съответното действие ще бъде отбелязано в трафичните данни, и следователно може бързо да бъде открито (отделно от процедурите и другите логове вътре в оператора) ако някой иска.
Аз обаче залагам на това, че записите са от СРС-тата на ДОТО тъй като имаме подслушване извършено по време, по което е имало разрешение от прокуратурата, от очевидно "правилно" оборудване (тъй като то е оставило индикатори - биипове във всички записи). Отделно Танов е знаел, че е подслушван от Цветанов и МВР, което е отличен косвен индикатор.
Така че вместо Цветанов да мисли как да набеди проблема там където той не е, да вземе да провери как информацията и СРС-тата изтичат от ДОТО нерагломентирано, защо не се установяват в срок, защо не са давани на прикуратурата и други важни въпроси, които няма да изчезнат дори и някак си да набедят Гошо чистача от фирма василка в Мтел, за направеното подслушване.

Петък, Януари 14, 2011

Прокуратурата призна, че записите са СРС-та, и на този хаос се готви май отново промяна на ЗЕС

Прокуратурата е признала пред БТА, макар и индиректно (с оправдание) в тази статия, че изнесените записи на Танов са все пак от СРС-та. Както е относително установимо. Нови записи се появиха и днес, те са не по-малко интересни, но не е ясно дали са от СРС-та.
Така или иначе, модифицирани или не, записите са от оборудването на МВР и те индикират, че:
  • Събирането им е в известна степен слабо контролирано (в хаоса между Софииска прокуратура, прокуратурите от провинцията, специалните групи за работа с МВР, е изпуснат контрола на записите и те не са предавани на прокуратурата в последствие, вече доста достоверно изглеждащо твърдение на Капитал), ако не и ужасно хаотично
  • Записите са изнасяни незаконно в нарушение на поне два закона (ЗСРС, ЗДКИ) и куп вътрешни правила в СДОТО/ДОТИ до външни лица. Дори да са модифицирани, това не оправдава изнасянето на данните, тъй като самото то от самосебе си е престъпление
  • За реално осъществена операция, с употреба на СРС, някой е предупредил подслушваният Танов и той е знаел (от записите), че е бил подслушван. Това означава тотално и постоянно изтичане на информация, вероятно и до престъпници, отново в нарушение на поне два закона
  • Записите не са унищожени (щом не са приложени като доказателство по дело в максимално отреденият срок - дело няма все пак) в нарушение на няколко закона, което определено подкопава доверието на обществото в замесените служби, по отношение на тази, изключително чувствителна за обществото тема, свързана с подслушването
На фона на този хаос, беззаконие, неспазване на вътрешни процедури и закони, изтичане на информация и ниска ефективност на СРС-тата, ние имаме работна група, която да предлага промени в ЗЕС, очевидно в полза на разширение на достъпа до трафични данни и намаляване на контрола, с цел "преодоляване на правните последствия" настъпили от последната промяна.
Такава промяна най-вероятно би била предложена между другото (скрита след другите промени) някъде около май, по референция от тук.
Любопитно е, как някой дебел, мустакат (с полицейски, а не гей мустак, разбира се) и плешив чичко, ще излезе сега по телевизора, за да защитава тези промени (в полза на по лек достъп до трафични данни и подслушване), оправдавайки ги, че обществото истерясва, тъй като нямало реални злоупотреби и много малко лица имали достъп до данните. Както забелязваме в последните 20 години, според статистиката на Български Хелзински Комитет имаме средно по два големи скандала със СРС-та годишно (без почивка) и куп други по-малки скандали, а за тези които не знаем (изтичане на информация и незаконен достъп) просто не можем и да си представим.

Четвъртък, Януари 13, 2011

Някой уточнения по повод "посоките" на прокуратурата по Тановгейт

В тази статия на Дневник тук се дискутират посоките, по които щяла да се движи прокуратурата за да разследва СРС-тата по Тановгейт. Аз имам мнение, и то е, че сякаш прокуратурата работи в посока да не открие абсолютно нищо (не знам дали нарочно, дали от невъзможност - не са допускани до техниката и данните, или от незнание). Но тази статия някак си не ме уверява, че се работи сериозно.
Обръщам внимание на няколко пасажа в статията -
Едната посока е експертизата на електронния носител (флашката), съдържаща телефонните разговори на Танов с финансовия министър Дянков и заместника му Горанов, които зам. главният редактор на в. "Галерия" Явор Дачков представи на медиите миналата седмица.

Целта на експертизата е да установи дали съдържанието на флашката е "пренесено" от компютъра на техническата служба на МВР, която е извършвала евентуалното подслушване.
Експерти уверили прокурорите, че тъй като подслушването в службите на МВР се извършва само дигитално, нямало никакъв технически способ да се заличи от флашката електронната "следа" от "подслушвателния" компютър, колкото и презаписа да са направени, тъй че това щяло да докаже произхода на записите. Ако се окаже , че записът на флашката е с източник МВР, ще има поне един обвиняем за изтичането на информация, заяви прокурорът.

Тези "експерти" очевидно имат в предвид ако е правено обикновено копиране. Но тъй като имаме твърдение от подслушваните, че записите са манипулирани, ако това е така то - при един transcoding ще бъдат загубени всички "цифрови следи", възможно е да се загубят и допълнителни индикатори (които аз се съмнявам да има) като watermark-ове дори и от най-елементарни филтри като low-pass filter, или дори echo cancellation, normalization, които често се ползват при налепване на разговори за да се изчиства фонов шум и да се изравнят разликите в силата а звука. Буквално безплатни софтуери като audacity поддържат такива филтри, следователно това твърдение изказано от прокуратурата е много слабо, освено ако не е изказано грешно или нямат нещо друго в предвид. Възможно е да е и двете. Ако случайно бъде открита въобще "следа" от "подслушвателният компютър", това би значило, че не е имало никаква последваща обработка, и тезите на танов, фидосова и т.н. за подправяне падат. Но аз съм убеден, че поне елементарна обработка замазваща следи най-вероятно са направени. Иначе би било много много глупаво.

Въпреки това, има косвени индикатори (същата техника използвана от Google в Youtube за да открива нарушавания на авторското право), чрез които по записа може да се установи дали е минал през телефона или през бръмбър, по закъснения от контролни точки (които се запазват при транскодинг и филтри) може дори да се индикира дали е минало през подслушвателно оборудване в мобилната мрежа (тоест оборудване на полицията - то увеличава някой закъснения двойно) или е подслушвано през радио канала в непосредствена близост (в общият случай подслушващият е трябвало да бъде на под 100 метра от подслушваният).

Все пак това е труден, косвен, и следователно безсмислен подход, вместо да се обърне внимание на преките доказателства - логовете на трафичните данни от мобилният оператор. Както споменах в предната си статия, от там безусловно може да се определи дали разговора е минавал пред подслушвателното оборудване на МВР в мобилните оператори. Ако отговора е да, то от там нататък разследването е изцяло в МВР. Ако е не, то по други индикатори може да се установи, кога, къде е можело да бъде направено това подслушване и да се търсят конкретни и други доказателства (например свидетелски показания), които вероятно там където се е намирал физически Танов (район с много хора), е изключително вероятно да има.

Втората посока на разследването е да се установи по документи дали и коя служба на МВР или поделение на прокуратурата е поискала подслушване на Танов и кой окръжен съд е дал разрешение.

Винаги досега този въпрос беше внимателно заобикалян от вътрешния министър Цветанов. По закон министърът последен поставя подписа си под разпореждане да започне подслушването и би могъл още при избухването на скандала да обяви ясно с "да" или с "не" дали е имало прилагане на СРС спрямо Танов. Остана загадка защо още не е установено това, след като то е въпрос на преглед на документация.

Ако под документи разбират и трафичните данни на мобилният оператор, то това е правилният подход. Имат и право, тъй като ЗСРС предвижда хипотези с тежки наказания. Ако обаче разчитат само на заявленията вътре в МВР, то това е хипотеза базирана на това, че записа е правен поне там относително законно, което не е задължително. Ако някой служител го е правил на частно, дори и в полза на министъра, то такива хартиени заявки/документи и дознания вероятно няма. Много по стабилен подход е този, който аз описах в предното ми писание.

Но има и още един много интересен път на разсъждения за разследване. Танов демонстрира учудващо добра памет за съответните си разговори, твърдейки че си спомня какво е казал, и какво не е казал (базирайки на това обвинение за подмяна на част от разговора). Това може да е отлично основание на прокуратурата и комисията за контрол на СРС да го разпита следните много интересни въпроси:

  • Защо Танов е бил убеден, че е подслушван?
  • Защо Танов е бил сигурен, че пет минути след затварянето на телефона някой е щял да докладва разговора на вътрешният министър?
Това са много по ключови, и вероятно много по проследими за назадничавата от гледна точка на разбирането на технологиите прокуратура (поне според демонстрациите, които правят по медиите).
Ако някой е издал на Танов, че е подслушван, кой е бил той? Какво му е казал? Той от къде е знаел? Защо не бъде разпитан? Ако е служител на МВР, то това означава, че подслушването е направено с техниката на МВР. Означава и че Цветанов е знаел за него. Следователно ако не се намери официална заявка, то значи че е станало в нарушение на ЗСРС със знанието на министъра (щом прокуратурата твърди че прокурорско и съдебно разрешение не е имало, то нарушение със сигурност има, Танов в самият разговор си казва че то е в МВР, въпросът може да бъде дали е със или без знанието на Цветанов).
Ако Танов е информиран от МВР, то значи е имало къртица. Дори подслушването да е било напълно регламентирано (и да се намери съдииско разрешение от долна митрополия след един месец, ако ще и подписано вчера, ама със задна дата) пак имаме нарушение на оперирането с класифицирана информация и на вътрешните процедури, щом подслушваният е знаел (информиран) че е подслушван.
Много е интересно убеждението на Танов, че разговорите се докладват на Цветанов. Това той може да е научил от своята къртица (Танов е бил в тези служби преди), но може и да е научил от разговори с Цветанов, който да му е демонстрирал информация, която не би трябвало да знае. Тогава със сигурност самият Цветанов е къртицата, а най-малко е знаел за подслушването. Това може по много интересен начин да се засече после с липсата на документи вътрешно в МВР определящи използването на СРС и твърдението на прокуратурата поне до момента, че тя не е участие и не е имало съдебно разрешение.

Самите подслушани разговори поставят достатъчно информация и косвени доказателства за участието на ДОТИ в процеса. Задължително останалите следи трябва да се проследят, но просто казвам че не са необходими дори технически засечки. Едно крос разпитване на следните лица - Танов, Цветанов, Дянков, шефа на ДОТИ (сегашното ДОТО) в МВР, и някой от началниците групи, заедно с шеф на отдел сигурност в съответният мобилен оператор. Тези няколко разпита вероятно ще изяснят много. А засечките по трафичните данни и другите "експертизи" просто ще заковат доказателствата. И всичко това може да се случи за 1-2 седмици. Ако обаче се бавят 2-3 месеца, нарочно, ще бъдат поставени в позиция да не могат да използават някой доказателства (събираните по ЗЕС).

Ситуацията е много интересна, защото истината може да се открие много лесно и бързо. А по времето на реакцията и каквото ни се каже, ще можем да разберем дали нарочно се прикрива, от кого, дали става въпрос за некадърност, прикриване, разхайтеност, която е се запази с години или ще бъде направено заздравяване на системата в полза на всички граждани.

----------------------
П.С.

Написаното отгоре е базирано на чиста логика, тъй като не разполагам със записите. Междувременно обаче ми дадоха линк към това чудесно писание ето тук - http://www.bivol.bg/home/item/733-bip-bip.html което напълно потвърждава моите тези.

От коментара там се разбира, че записа е вероятно маркиран с бипове, на равни интервали, вероятно с конкретна специфика, която може да покаже техният ред, време, и оборудването, което е направило подслушването.
Обработвалите записите не са си крили много следите, щом тези бипове са запазени, тъй като low-pass и high-pass филтри могат да ги изчистят.
По биповете блогъра прави много точното предположение -
  • Че записа е правен от най-вероятно от оборудването на МВР (от тук нататък следват супер интересните въпроси как МВР прави подслушване, при условие че няма прокурорско и съдебно разрешение изисквано по закон, и дали Цветанов го е подписал, и защо Танов е знаел и защо е бил убеден, че Цветанов е знаел и е бил информиран веднага), с което всякакви идеи за частни записи (а аз отбелязвам - правенето на такива е много трудно и е ограничено от физически контрол, който позволява сравнително лесното откриване на извършителя)
  • Че е имало монтажи (биповете стават на неравномерни интервали на места, както и вероятно не спазват патерн последователността си), но по интересното - тъй като фоновият шум е еднакъв, монтажите са вероятно правени от записи в същият разговор, а не както се твърдеше "различни разговори" (което е як камък в градините на твърдящите).

Сряда, Януари 12, 2011

СРС разследване - сбъркана логика

Събирам изречения от новините днес, за това как се правила проверката за това дали СРС-тата (подслушваните разговори на Дянков и Танов) са незаконни, и изпадам в потрес, тъй като ако изреченията са вярни, то значи сериозно се работи в ползва на това да не се открие нищо.

"Текат проверки в прокуратурата в цялата страна, за да се разбере дали е имало искане за СРС срещу Танов. Ако е имало искане, ще се проследи как ..." СРС-тата са изпаднали "... ако не е имало искане, значи частни лица са направили подслушането" изказаха по новините в БТВ и Нова Телевизия.

Тази логика е странна и сбъркана.

Ако СРС е било направено незаконно от ДОТИ в МВР без да е имало насрещтно искане в мобилните оператори то няма да бъде хванато от такава хипотеза. Тъй като няма да е имало искане в прокуратурата, но е нямало да бъде извършено от частни лица.

А логиката е много проста и тя е напълно в правомощията на комисията за контрол над СРС или в прокуратурата -
1. Чрез разпит се установява приблизителното време, в което е станало съответното подслушване. То е очевидно и от медиите.
2. Не е преминала 1 година от тогава (7-8 месеца са някъде) тоест може да се вземат разпечатки и локационни данни от мобилните оператори (а в този частен случай става въпрос за само един такъв)
3. Засича се последователността на разговорите спрямо разпечатката и по патерна се намират точните обаждания и съответните им точни дати
4. Проследява се вътрешната документация в МВР в този период дали е имало заявка. Проверката започваща от прокуратурата е грешна, тъй като те биха били участник само ако СРС-тата са събирани законно. Ако обаче са събирани законно или незаконно от МВР/ДАНС, или който и да е, освен ако е изтекла от мобилният оператор или с бръмбър на телефона на Танов, което е абсолютно сигурно, че не е вярно (иначе веднага може да бъде установено) то би следвало да има отбелязана акция на поне няколко места в МВР (по спазена вътрешна процедура) или няколко контролни лога в мобилният оператор (пътя на сигнализацията на съответното подслушано обаждане се архивира и може да се види през кое устройство е преминала)
5. Ако е имало заявка се проверява за подпис от министъра (той е задължен или оторизирано от него лице да подписва заявките) и след това съответното съдебно разрешение. Министъра не може да подпише без съдебно разрешение освен в изключителни случаи, до 24 часа предварително преди да бъде дадено разрешение. Ако има подпис от министър но няма разрешение от съдия, тогава министъра е виновен
6. Ако няма подпис от министър и съдия, но има заявка в ДОТИ, значи виновен е някой в ДОТИ, структурата не спазила правилата и закона, и този който е подал заявката
7. Ако няма заявка (както съм почти сигурен, че ще стане), няма известяване (писмено) на министъра, и няма съдебно разрепение, по подробният запис на оператора се проследява пътя (сигнализационният) на обаждането (логовете са по спецификация на ЗЕС и са все още в пазене) и се вижда дали е минавало пред подслушвателните устройства на МВР. Макар министър Цветанов веднага да обвини мобилните оператори, че те могат лесно да подслушат, това ама въобще не е лесно. Трябва такова оборудване, а то е под контрол на МВР и мобилните оператори имат малък контрол. Отделно министър Цветанов спекулира, че "линиите на МВР са прекъснати до операторите" но това е изключително невярно. Законът не допуска прекият терминален достъп в случаите третирани от ЗЕС - трафичното проследяване, но това въобще не е вярно в случаите третирани от ЗСРС - чистото подслушване, и там оборудването е под пряк контрол на МВР, макар те да са задължени формално да го активират и спират по процедура.
8. Ако трафикът не е минавал през оборудването на МВР (отново да кажа записите в операторите позволяват изключително лесно доказване и проверяване на това) то сигнализационният път определя много малко места където да може реално да бъде подслушвано и може да се проследи по вътрешна процедура кои са били служителите на оператора били там в съответното време.
9. Ако (в което съм 99% сигурен, тъй като отново да кажа - много е трудно да стане иначе, освен ако някой не е бил в непосредствена близост до Танов, последният пък да е ползвал 2G свързаност - което отново според трафичните данни може да бъде бързо установено) обаждането е преминало през оборудването на МВР, то може да се определи лесно дали е употребявано от служител на мобилният оператор (всъщност достъп до това оборудване от служителите на операторите е изключително силно ограничен, от липсата на знания, информация, електронна оторизация, както и от ограничен физически достъп) или от МВР. От там нататък разследването може да е само вътрешно в МВР съгласно вътрешните им процедури - тъй като те имат вътрешни логове, логове в оборудването и купища заявки, протоколи, и законнови "регистри" където трябва да се отбелязват всички действия и операции

Казано на кратко, без да се излиза от МВР с няколко крос засечки прокуратурата и комисията за контрол на СРС могат да засекат всичко, което ги интересува. Тук има един лек проблем - за да изискват разпечатки, трябва да има предположение за престъпление с наказание затвор 5 или повече години. Доста хитро и контролно нарушенията по ЗЕС предвиждат 3 години, което значи че проследяването на нарушенията не може да става чрез използване на същите СРС-та или разпечатки, които са били нарушени. Дефакто, отраз са отрязани ръцете на евентуалните проверяващи, макар относително добър механизъм да е предоставен на комисията за защита на личните данни (макар и да не и е вменено все още това право, тъй като съответните промени вече драматично се бавят повече от година, май). В частният случай на СРС-та обаче има предвидени разширения на наказанията, които достигат 5 и повече години, и всъщност се позволява пълно и бързо и ефективно разследане, стига да има желание.

Обаче аз виждам от изказаните по телевизията изречения, че такова ама въобще не се прави. Почва се от там, където е ясно предварително, че няма нищо да се намери и повечето хипотези изключват намирането на информация там. Съответно мястото където всички хипотези определят, че със сигурност има информация въобще изглежда да не се проверява. Още малко и ще паднат записите по давност и няма да може и да се провери. Така че ако прокуратурата успее стратегически да се забави с 2 месеца, разследването ще бъде принудено да обяви, че няма доказателства и е много вероятно подслушването да е извършено от частно лице, което е било постоянно в 100 метрова близост до Танов (чиито път няма да може да се проследи), и е използвало специално скъпо и трудно внесимо оборудване, с ниска вероятност на успеваемост.

Вторник, Януари 11, 2011

Лафове по повод масовото събиране на СРС и подслушване


Безспорно прекаляването на употребата на СРС е израз на слабостта на МВР, Следствието и Прокуратурата да събират въобще доказателства. Натиска СРС да се признава като единствено доказателство е индикатор за това. Опитите (които изглежда текат и сега) за разширяването на допуска до употреба на СРС или случаите, в които се достъпват трафични данни (разглежда се нова промяна на ЗЕС) е също такъв индикатор. Самият факт че у нас по официална (тъй като е ясно че тя показва по-малки стойности от неофициалните) статистика се събират повече СРС-та годишно отколкото в Германия, Франция и Великобритания взети заедно, но от тях доказателства по дела стават по малко отколкото 1/10 от събираните СРС-та в която и да е от тези страни е колосален индикатор на невероятното изкривяване, на начина по който се провежда разследване у нас. Дори напоследък има натиск СРС-тата да се употребяват за превенция (нещо несъществуващо в нито една друга държава в Европа) – както се изрази премиера а аз леко го перифразирам „като знаеш че си подслушван ще си послушен“.
Но това, че вече са се появили лафове и вицове в народонаселението по този въпрос е вече невероятен индикатор за това, че нещата са преминали границата, заради която навремето на всеки милиционер му викаха (и то не случайно) „ушев“.
Ето една кратка колекция от лафове, движещи се по туитер напоследък (но и не само):
  • Обажда се министър на жена си по телефона. И още преди да започне разговорът, се чува: "Биип. Заради ограничения бюджет на МВР в момента вашият разговор не се подслушва. Моля, обадете се по-късно. Вашият разговор е важен за нас"
  • МВР излиза на пазара на електронни съобщения - http://www.asengenov.com/2011/01/blog-post_08.html
  • МВР смята да навлезе и на пазара на Импулсните телефони, с новата услуга: "Слушай министър по твой избор".
  • "Ало, МВР ли е?" 
    "Да, кажете."
    "Обаждам се да ми проверите СРС-то да кажете колко кила домати искаше да купя жена ми, че забравих."
    След малко получава отговор - "Жена ви каза 2кг и че ви обича, за да чуете други разговори на жена си, платете за абонаментна услуга във всяко поделение на ДОТО в страната"
  • Стар, но златен, и вече отново актуален - двама непознати са настанени заедно в хотел и единият непрекъснато разказва политически вицове. Другият го предупредил, че може би ги подслушват, но оня не престанал. Тогава човекът се доближил до контакта на стената и пошушнал: “Две кафета за 214-а стая, моля.” И не щеш ли - след малко на вратата се почукало и камериерката влязла с две кафета. Разказвачът на вицове пребледнял и тутакси си легнал. На сутринта другият се събудил, разказвача го нямало, а на масичката до леглото имало бележка: “Вас засега няма да ви арестуваме, защото на майор Петров много му хареса номерът с кафетата”.
    • Цветанов звъни на СДОТО - "моля пратете ми флашката с разговорите на Ваньо Танов". "Ама коя версия, господин министър? Тази за вас, тази за премиера или онази за в.Галерия"?
    • Ваньо Танов звъни на Дянков и казва "Здравейте господин Цветанов". "Има някаква грешка, аз съм Дянков", "Знам" казва Танов "ама нали и Цветанов слуша..."
    • При набиране на телефона на министерски съвет се чува следното меню - "За премиера Бойко Борисов натиснете едно, за вицепремиера Симеон Дянков натиснете две, за вице премиера Цветан Цветанов не натискайте нищо"
    • Новият девиз на МВР - "Това е твоят глас"
    • Новият патрон на МВР - Димитър Талев (заради "Гласовете ви чувам")
    Вие знаете ли други?

    Събота, Януари 08, 2011

    Малка, но съществена разлика, за това дали политиците трябва да се подслушват

    Попитали Борисов дали е нормално министрите да бъдат подслушвани.
    Той казал "Властта трябва да бъде слушана за да бъде под контрол".
    Подобно твърдение изказва и Росен Петров тук.
    В това изречение има истина. И за това много хора го подкрепят. Но истината е изкривена. И поради това хората се объркват.
    Да, властта трябва да бъде изложена на контрол. Но този контрол трябва да е публичен. А не в полза на лица, които имат незаконен достъп до СРС-тата, както виждаме.
    И щом има незаконен достъп до СРС-та, които очевидно не влизат в съдебно дело, и не са унищожени по процедура и закон, а (поредното им) изпадането им (както и излизането на информация до подслушваните, че са подслушвани) е силна демонстрация на неспазване на вътрешните процедури и Законът за достъп до класифицирана информация, е по-добре тези СРС-та да не се събират въобще. Защото те не помагат на обществото. Те вредят на обществото по толкова много начини, че няма да ми стигнат дни да го обясня, най малкото, от които например е, че някой е под контрола на ограничена оторизирана клика, вместо на избирателите си.

    В този смисъл премиерът не е прав, напротив греши. Ако властта трябва да бъде слушана, ТО ТЯ ТРЯБВА ДА Е СЛУШАНА ОТ ИЗБИРАТЕЛИТЕ И, в стил Wikileaks. Така контролът се извършва от този, който в демократичното общество е единствено оторизиран да го прави. Но да бъде слушана, от ограничена клика, без от това да произлиза моменталически дело, в набор от нарушения на закони и процедури, не трябва.

    Четвъртък, Януари 06, 2011

    Господин Танов, ЦвеТанов - от социализъм не лекуваме!

    Пореден организиран скандал тече със СРС-та у нас. Публикувана разпечатка от СРС-та във вестник по твърдение близък с разследваният Алексей Петров. Дискусията от своя страна е подкрепена от Румен Петков, по твърдения от СРС-то, рядко трезвен.
    И всички се фокусират върху това, кой го публикува, кога и какво съдържа разговора.
    Външният министър Младенов пита защо това се публикува сега?
    Танов, Цветанов, Дянков и премиера Борисов пък казват, че разкритото съдържание не е кой знае какво и от него голям проблем няма, ако се изключи факта, че се намеква, че има протекционизъм върху фирмите от групата на Лукойл.
    Обаче какво значение има какво е съдържанието, аз съм съгласен, че то не разкрива нито незнайна информация, нито нещо ново или наистина проблемно.
    Както и какво значение има кой го публикува и кога точно? Тъй като това не е първи случай. Много по важен въпрос, е защо въобще може да се случва, и защо това няма да е последен случай.

    Важните за мен въпроси, на които всички сякаш се опитват да избягат да отговорят, а всички журналисти старателно се опитват да заобиколят са:
    • Кой и по какъв повод е разрешил това подслушване? Премиерът веднага се изказа по БНТ, че това е било по прокурорска проверка с надлежно разрешение от съдия. Но тъй като по закон в рамките на 6 месеца СРС-то трябва да влезе в дело или да бъде унищожено (а този срок е минал), къде точно е делото, по което това СРС е приложено като доказателство?
    • Защо след като е изтекъл максималният разрешен по закон срок за задържане на СРС-то, то не е унищожено?
    • Как въобще СРС-тата (дори и уж унищожени) могат да изпадат от системата, от загрижени граждани? Това не е първият случай и как въобще се случва това? СРС-тата са класифицирана информация по закон, а законът за класифицираната информация у нас определя точно кой как и по какъв начин има достъп до нея. Законът е копиран по НАТО стандарта. Там се описва как информацията се предава от едно лице на друго, и би следвало той да гарантира достатъчна превенция, и проследимост на оперирането с такава информация. И ние имаме две възможни хипотези - или неработещ закон, или неспазване на закона, очевидно в МВР. Кой ще провери това, и какви последствия ще се вземат срещу му? Спомням си как миналата година, по време на дискусиите за ЗЕС, някакви лица от МВР и най-вече вече бившият секретар и после министър Павлин Димитров обясняваха по медиите, че напразно обществото се притеснява от разширяване на достъпа до трафични данни и подслушване, тъй като няма риск и всичко се контролира от тежки процедури в МВР, а с данните работят изключително малко хора. Много ми се ще сега някой да дойде от същите тези хора, и да ми обясни на мен и на обществото, как тези тежки процедури са гарантирали данните да не изтекат, и ако с тях работят много малко хора, как точно данните са изтекли и кой ще бъде наказан, след като "при толкоз малко хора" няма начин да не може да се разбере кой точно е извършил подслушването и е имал достъп до тези данни.
    • В парламента има комисия за контрол на СРС-тата (преди бе агенция, но отново се върна под парламентарен контрол). Тя е задължена по процедура да проследява случаите на неправомерна употреба както и случаите на изтичане на информация. Толкоз много народ се обади, прокуратурата уж се самосезира по случая да разследва вестника, но какво точно прави единственият оторизиран в държавата орган за контрол - съответната комисия, по проследяването на изтичането на тази информация?
    • Някой се оплака (от прокуратурата, започнала разследване), че е невъзможно да се проследи как едно СРС е излязло от системата и е достигнало до знайни и незнайни лица. А аз се чудя как според супер стабилните процедури похвалени неведнъж от Павлин Димитров и законът за достъп до класифицираната информация това е възможно? Освен ако, разбира се, както обществената тайна казва, в цялата система няма един колосален хаос и беззаконие?
    • Защо и как Танов, имащ картонче от ДС (както той се похвали) и бивш масивен потребител на СРС-та (от работата си в МВР) знае, че е подслушван (от записаният разговор)? Каква е тая пробита манерка, дето позволява не само да изтича информация от резултата от подслушването, но и да предупреждава подслушваните?
    • Защо Танов, на базата на неговият опит от системата, е сигурен (отново от разговора), че на мига след като му запишат разговора ще докладват на министъра, при условие че той не е на пътя на информацията от СРС (тя трябва да стига до прокуратурата, а достъп до нея трябва да имат изключително малко лица)?
    Тези въпроси за изключително важни. Тъй като самият факт, че мога да ги задам, демонстрира една разбита система, с невероятен хаос, невъзможност за проследяване на това, което става, изтичане на информация, свръх подслушване в полза на политически лица (министъра, политическо лице, нормално не би трябвало да има информация), и изключителна неефективност (имайки в предвид че според експерти у нас се дават 50 пъти повече средства за подслушване отколкото във Великобритания, но от тях стават доказателства 10 пъти по малко).
    Без отговор на всеки един от тези въпроси не може да се реши проблемът с неефективността на СРС-тата. Защото безспорно информация от тях изтича. Изтича и информация за употребата им (ако не изтича за съдържанието им). Отделно има прекомерен достъп до информацията от политически лица. Отделно се вижда, че контролните системи (вътрешни за МВР, и външни - в парламента) очевидно не работят.
    Бързият отговор на тези въпроси е изключително важен. Защото отново, в рамките на последните 4 години за 5ти път, е създадена работна група за промяна на ЗЕС а вероятно и ЗСРС, с цел разширяване на достъпа извън тежки престъпления, в полза например на защитата на авторското право. И отново някой ще обяснява по телевизора, че рискове няма, отричайки очевидното. А аз си спомням старият виц - "докторе едно виждам, друго чувам! а-а-а от социализъм не лекуваме!".

    И да не забравя, важно е да отбележа, че тези проблеми не са от вчера.
    Такива проблеми имаше и по времето на -
    Румен Петков и Тройната Коалиция - случайното изпадане на СРС, което уж трябвало отдавна да е унищожено, за един доктор, случайно предвождащ в същият момент протест на лекари от Пирогов. И куп обвинения и други СРС случаи.
    Костов и ОДС - Бръмбъргейт и Никола Филчев, както и няколко други скандала (Богомил Бонев и ген. Атанасов).
    НДСВ.
    БСП и Виденов.
    Филип Димитров и СДС - множество случаи, правителството е сериозно засегнато от скандала.

    Анализ за тези скандали на Българският Хелзински Комитет може да прочетете тук - http://www.bghelsinki.org/index.php?module=pages&lg=bg&page=obektiv14514

    Това не са единични случаи и говорят за проблеми тлеещи отдавна. Фокусирането върху последствията, а не причините никога няма да реши проблемите. Днес СРС-тата ги вадят едни, утре други. А трябва да бъдат разрешени проблемите защо СРС-тата излизат не по предназначение и поради какви причини се правят въобще.

    Определено подслушващите служби са в невероятен дълг към обществото, и аз държа да чуя тяхното оправдание, а не отново разчитане в стил Румен Петков и президента Първанов (и катастрофите на НСО) - да принижим три дни и да се надяваме нещата да преминат.

    Вторник, Януари 04, 2011

    Децентрализирана инфраструктура за Wikileaks на английски

    С мен по twitter се свързаха от Балканлиикс и ме попитаха за разрешение да преведат статията ми за модел за децентрализирана инфраструктура за wikileaks. Тъй като всичко публикувано в моят блог е с "cc" лиценз, аз естествено нямах нищо против.
    Всеки, който желае да прочете превода на англииски може да го види ето тук - https://www.balkanleaks.eu/diw.html

    Понеделник, Януари 03, 2011

    Децентрализирана инфраструктура за Wikileaks

    Съгласно предното ми писание описвам идеята за създаване на дистрибутирана архитектура за реализацията на Wikileaks сайт без необходимост от наличието на хостинг провайдери и хардуерни сървъри.

    Идеята е проста – всеки участник да си изтегли и стартира малка програмка, която да се прави на web сървър и да сървира файловете и информацията на сайта. По този начин всеки, който желае да участва и да помага на wikileaks е достатъчно да инсталира на компютъра си малък софтуер, който не би отнел много ресурси. Ресурсите не са проблем, тъй като Wikileaks тип сайтове заемат малко място. Не е проблем и скоростта за достъп до Интернет тъй като ще става въпрос за достатъчно много потребители, които сборно ще осигурят огромен капацитет, докато поединично (на една сесия, за участък от сайта) не е необходима висока скорост за достъп до малки web файлове, а големите файлове за данни ще се транспортират дистрибутирано чрез peer to peer техника от типа на bittorrent, рекомбинираща скоростите на много участници.

    (Wikileaks сайта се състои от 2 типа файлове – web страниците, които са много малки – 2-4kb, и самите документни файлове, които се теглят като архиви и ще бъдат торент файлове)

    Създаването на дистрибутирана архитектура, която да създаде инфраструктура за услуги от тип на Wikileaks е техническо предизвикателство.

    Системата трябва да бъде:

    • Максимално опростена – не трябва да се изискват специални познания за да се използва или инсталира от участниците

    • Да бъде напълно автоматизирана, с цел да минимизира умишленото участие от страна на потребителите при каквато и да е операция

    • Трябва да бъде open source за да се пресекат евентуални злонамерени слухове за потенциална злоупотреба от създателите на софтуера за цели извън прокламираните и подкрепени от самите потребители

    • Трябва да позволява да се превърне в web server всяко PC дори и намиращо се на домашен компютър и в домашна или публична мрежа

    • Трябва да позволява лесно насочване на потребителите към най-лесния и близък сървър

    • Трябва да може успешно да се скалира до около 1 милион хоста

    • Трябва да бъде максимално защитена

    • Някой операции изпълнявани там (например качване на информация) трябва да бъдат изпълнени максимално анонимно, така че да не могат лесно да бъдат проследявани инициаторите им

    • Информацията, която е публикувана на web сървъра трябва да е проверена и достоверна, с цел невъзможност за злоупотреба (някой да сложи информация, която не трябва да е там)

    • Трябва да използва някаква публична инфраструктура, с цел по трудно стопиране на услугата и по лесно размножаване на информацията

    Особено проблематична е комбинацията от изисквания – публична инфраструктура, open source и анонимност.

    Няма много стабилни и децентрализирани публични инфраструктури.

    От своя страна Wikileaks използва доста добре bittorrent инфраструктурата. Всичките и файлове се намират там. Bittorrent (в случаите когато се използва DHT и PER) може да бъде децентрализирана.

    Но е лошо проектирана:

    • Не е отказоустойчива, при отпадане на Node може да мине доста време преди DHT дървото да се възстанови отново

    • Bittorrent (и въобще Kademila) DHT е структурирана децентрализация. Тя създава дърво, на което обаче root node (router, boot strap node) трябва да е предварително известен (статичен), иначе не може да се структурира/създаде, и при отпадане на node да се възстанови. Така например ако router.bittorrent.com изчезне, ще изчезне цялата DHT мрежа. Приемам че този риск е минимален.

    • Не позволява (стандартно) търсене по имена или част от име.

    • Не позволява (стандартно) търсене в, и добавяне на допълнителна информация към файловете

    • Не позволява пренасянето на съобщения в мрежата (всякакви)

    • Тотално не анонимна структура е. Лесно се открива кой кой е. Лесно се открива кой е първоизточник на даден файл. Това е голям проблем по отношение на скриването на източниците.

    • Голям плюс е възможността да намериш файл по HASH чрез магнет линк. Няма нужда от торент файлове и от тракери. Недостатък – няма децентрализиран механизъм за обмяната на магнет линковете и съпътстващата ги информация, нещо, което да замести напълно нуждата от съществуването на web сървър.

    • Въпреки, че peer-to-peer комуникацията може да бъде криптирана между двама обменящи си файл, самата DHT система не е защитена, не е криптирана. Отделно структурата се поддава на Man In the Middle атаки. Отделно е изключително неустойчива на спуфинг – всеки който вкара хешове подобни на файловете, които иска да спре, може да блокира трансфера на всеки файл. Отделно самата структура на DHT-то може да бъде разрушена от един единствен компютър (анонсиращ се като на колкото се може по-близък до root node и отговарящ на всички търсения с фалшиви нодове, уж директно закачени за него). Добре разработена от гледна точка на сигурност е maidsafe-dht (имам забележки, пак може да се разруши с атака над руут нода, липсва им и white-noise прикритие), но тя не се поддържа от bittorrent клиентите и се загубва идеята на публичната инфраструктура.

    Въпреки всичките си недостатъци, аз реших да заложа на Bittorrent с DHT инфраструктура. Причината е много проста – всеки, който има битторент клиент, дори да не бъде web сървър инсталирал специалният софтуер, може да бъде и да подсигурява инфраструктурата на сайта, а това значи лесна размножимост до милиони. Технически дори някой да иска да спре бит торента, той ще е „пост фактум“, след като информацията се е размножила и ще бъде притежание на хиляди. Отделно бит торент DHT протокола е лесен за възстановяване при умишлен краш (макар и с ръчно усилие), всеки път при падане на руут нод, може да се направи нов, или може да се направи нов bootstrap на DHT-то, ако трябва може да се направи нов тракер и всичко да започва отначало. Технологията е точно толкова устойчива, колкото са нейните поддръжници. Повече поддръжници значи невъзможност за спиране. А това дали ще има такива или не, не е въпрос на закони, а е въпрос на морал. Ако хората вярват, че нещо е справедливо и редно да се случва, то ще се случва.

    Та така, следните задачи/проблеми е редно да бъдат решени:

    • Най на първо място – как да обменям съобщения по DHT. Съобщения ми трябват, защото торент протокола не поддържа механизъм за автоматично обновяване на файловете от даден торент, ако работи през DHT (въпреки че такава техника, макар и частна за някой клиенти, съществува при наличието на тракер). Следователно аз трябва да намеря механизъм да известявам клиентите реализиращи web server-и, че има нова версия на пакета за уеб сайта, или някой от системните файлове. Също така при ъплоад на нов файл от „анонимен източник“ е добре останалите да могат да бъдат нотифицирани да го получат.

    • Как да запазя анонимността на източника на съобщение. Това е принципен проблем при торент DHT. Дори при използване на анонимни проксита като TOR има механизъм как да се накара нода да си (по)каже реалното IP. Трябва сериозна модификация на библиотеките и протокола, но аз исках да ползвам популярната библиотека libtorrent rastebar без никакви модификации (опростяване на кода, и по лесни ъпгрейди), с цел по добро наследство.

    • Как да подсигуря вершънинг – механизъм да знам дали има по-нова версия на съобщението, торент, компонент, заобикаляйки недостатъците на стандартната DHT мрежа, не позволяваща търсене по име или част от име, а само то точен HASH стринг.

    Как да наименовам компонентите?

    В DHT има само един елемент служещ като вектор към информацията – това е хаша на файла.

    И аз използвам трик - създавам торент HASH код с предназначението на файла (който ми служи като системно име) – той се състои от 160 бита (20 байта), от които „WIKILEAKS“ префикс, един байт версия на протокола „00“, след което следват два байта тип на кода/файла (от 0001 – 000F са сертификати, 1000 – основният Web сайт, 1111 – съобщения, 1010 – неоторизирани допълнителни файлове за качване, 8080 – оторизирани файлове, на които се вярва), следват 4 байта за идентификатор за различен файл (тези които не са различни са винаги 00000001) и последните 4 байта са версия на файла.

    Най-важният файл – файла с уеб сайта се проверява в DHT-то за теглене с предварително закодираният в клиента hash. Ако е вече изтеглен се проверява неговата достоверност чрез RSA сертификат (публични и частни ключове), публичният ключ на който е предварително записан в клиента. Така само притежателят на частният ключ може да публикува. След като се изтегли и верифицира успешно, започва да се опитва да се изтегли по-новата версия (частта за версията увеличена с единица). Ако RSA оторизацията не мине, изтегленото се игнорира. Няма как някой да сложи фалшив файл, или да модифицира версиите, без да притежава частният ключ за публикуване.

    Методът за web съдържанието се използва реално за теглене на всеки файл с изключение на неоторизираните файлове с префикс 1010.

    Възможно е обаче някой да публикува в DHT файл, чиито хаш да съвпада с хашовете, които аз използвам. Има два начина да се случи това – случаен и нарочен. Случайно, е невероятно рядко да се случи заради начина, по който се генерира торент хаша. Дори да стане, не е проблем тъй като част от клиентите ще получат правилни пииъри, и макар част да получат грешни, на последвалата верификация ще се изхвърлят грешните от добрите.

    Възможно е някой обаче нарочно да зашумява с фалшиви добрите пиъри с цел да попречи на разпространението на информацията. Тогава е необходимо – той да може да бъде открит (верификацията на изтегленият файл срещу node id-то на DHT node-то анонсирало проблемните пиъри е механизъм за това) и да може да бъде блокиран.

    Тоест DHT клиентите да не закачват блокирани нодове и да не взимат информация от блокирани нодове. Това е един от големите недостатъци на днешният торент DHT – няма механизъм за изолация. И аз си създадох мой – един от специалните файлове (оторизиран с RSA ключ) носи информация с лошите пиъри. Достатъчно е да има (поне) един клиент в мрежата, който да знае частният ключ за публикуването на този списък, и да прилага следният алгоритъм – ако верификацията на някой от файловете не мине, вредният нод посочил грешни пиъри се проверява и се вкарва в списъка (процесът може да е автоматичен). Останалите след като обновят списъка просто изолират този нод от мрежата (изолацията може да е и умна, като за целта един нод може да го изпълнява с по-интелигентен клиент и да лъже лошите нодове, че са регистрирани за него, но същевременно търсене никога да не стига до него).

    С цел да се опитвам да държа анонсите само в нодове, които са в дърво поддържащо моят алгоритъм, аз използвам хашове за нодовете (създадени и добавени в мрежата от моят софтуер) използвайки същият алгоритъм като за хаша на файловете – WIKILEAKS000000000000 + уникален идентификатор (създаден от случаен алгоритъм). Така DHT XOR алгоритъма за определяне на дистанция ще преферира винаги при анонсиране и търсене моите нодове.

    Всеки различен тип файл е криптиран с различен RSA ключ. Всеки публичен RSA ключ е файл и може да се изтегли през DHT мрежата. Всяка следваща версия е криптирана частният ключ на предната. Стартовите клиенти ще имат 3 или повече версии на публичният ключ предварително заредени. Така при добра техника (липса на държане на частните ключове на едно и също място в едни и същи лица) на безопасност се намалява риска от компрометиране на частните ключове, тъй като те могат да бъдат подменени в движение на всички клиенти, без да се налага преинсталация. Това значително ще затрудни опитите за публикуване на неоторизирана информация в оторизираният списък.

    Така притежаващите частните ключове могат да публикуват майн-стриим оторизираните файлове. Те обаче са фиксирано ограничено число, и техните хаш префикси се знаят от клиентите предварително. Единствената информация, която е динамично променима е евентуално магнет линк към файлове публикуващи информация (от Wikilekas). Но тези линкове ще бъдат в някоя Web страничка на web частта.

    Всяка различна оторизирана публикация (web, rsa ключове, обновяване на сървърският софтуер, и т.н.) използва различна двойка RSA ключове. Обновяването на всеки RSA ключ използва нова различна двойка RSA ключове. Така, макар ключовете да са много, значително се намалява риска от компрометиране на една двойка ключове (чрез извъртяване или чрез открадване), и се запазва възможността за бърза реакция и подмяна на ключовете и дори самият софтуер, преди да е настъпила сериозна вреда, каквато и да е компрометираната RSA група (осен ако не са компрометирани всички едновременно, а този проблем трябва да се контролира физически).

    Аз искам през моят клиент да може да се публикува неоторизирана информация, която да се пази от инфраструктурата (макар и да не се вижда на web-а).

    За нея имам два проблема -

    • как да известя другите клиенти, че има нещо (ново), което е важно да изтеглят и кешират при себе си, макар и да не го публикуват на web-а

    • как да запазя анонимността на източника ако мога

    • как да не позволя на MIM патерн устройства да могат да идентифицират по патерн какво се транспортира

    Срещу патерн откриването използвам peer to peer торент криптацията (obfuscation protocol). Също така е препоръчително информацията да е събрана в компресиран архив и с допълнителна криптация отгоре (за да не могат да се видят и имената на файловете в архива). В бъдеще време ще вкарам вграден архиватор/криптатор със зашумяване (добавяне на случаен и излишен префикс-суфикс към файла) в моят клиент.

    За известяването на клиентите използвам вградената възможност при peer to peer комуникация да се разшири стандартният бит торент протокол (и libtorrent поддръжката му) (bittorrent extension protocol – BEP) и съм си създал свой протокол.

    Съобщение с префикс Wikileaks-версия-команда (msg push)-хаш на файла, който трябва да се изтегли. Отсрещната страна потвърждава или отказва протокола, но не казва нищо за действието, което ще предприеме. Ако го откаже – значи е стандартен клиент. Ако не, значи е моят торент клиент.

    Тук обаче има проблем с анонимността. Достатъчно е някой да има един клиент (поддържащ протокола) и да следи кой първи анонсира нов файл, и по IP адреса ще го успее да намери къде е в момента с всички последствия (евентуален обиск, съд и т.н.).

    За да намаля риска, използвам техниката на създаване на шум чрез случайност – новият файл не се анонсира на всички пиъри а само на един от тях, избран случайно и то след случаен интервал от време (със забавяне от до 4 дни, средно 2).

    Той от своя страна го анонсира на някой друг спазвайки този алгоритъм. Това изолира драматично възможността за проследяване на първоизточника на данните, защото не знаеш кой подред е бил този, който ти прави анонса и след какво време. Също така не можеш да оцениш, кой има файла, кой не, и тъй като в анонса не е записана информация предпазваща от зацикляне, не можеш да направиш обратно проследяване, ако не подслушваш поне 1/3 от всички пиъри на всичките им мрежи за достъп, което при определен обем (над 2000 пиъра) и географска дистрибуция ще бъде изключително трудно.

    Тази техника позволява и добра мобилност, анонси могат да се правят от web/интернет кафета и други публични места. Хаша на ъплоадвания неоторизиран файл ще е случаен (няма да следва останалите алгоритми), следователно ще е технически невероятно проследяването на целият спектър 160 бита за да следиш за нови файлове и да ги различиш от нормалните публикувани в DHT (тоест сред шума).

    Недостатъка на тази техника е липсата на loop prevention механизъм (предпазване от зацикляне) – може да се направи анонс на пиър, който вече има файла. Това обаче не е проблем заради много големите таймаути (което намалява възможността от флууд, докато броят на клиентите съставляващи инфраструктурата чрез моят специализиран софтуер е по-малка от 400000, което е едно добро число).

    Недостатък, който обаче остава е факта, че времето за редистрибутиране на нов файл между всички пиъри би било равно на максимално 4 дни по (1 + 1 / 2 + 1 / 3 + 1 / 4 + .... 1 / n ) където n е броят на пиърите. Но това не е голяма драма, тъй като дори при 1000000 пиъра максималното време би било някъде около 14.4 * 4 дни = 57.6 дни, но ще е покрило 80% от пиърите за 20-25 дни и ще е обменило файловете до тогава.

    Как откривам кои са пиърите, с които мога да комуникирам? Това са всички тези, които анонсират, че вече имат зареден хаша на web сървърните файлове (търся предварително познатия хаш и след това получавам пиърите за него).

    Това че участниците (пиърите) могат да бъдат извлечени бързо е проблем за анонимността им. От друга страна, публикуването на информация не е престъпление. Престъпление може да бъде открадването и, но не и публикуването (което се пази от първата поправка в американската конституция и от общата свобода на словото и законите за приоритет на общественият интерес в Европа). Това е нещо, с което дори ДАНС се сблъскаха у нас (Опасните.нет), така че си е стабилно законово правило в западният свят.

    Заплахи за съучастничество също не могат да бъдат проблем за използването на подобен клиент и публикуването на информация, тъй като отново – трябва съучастие в открадването на данните, а не публикуването им, и трябва умишленост на действията, което напълно освобождава от отговорност всички потребители на моят торент клиент, тъй като те нямат проявена инициатива към всяко публикуване конкретно. Общата и индиректна отговорност не съществува в такива случаи, тъй като иначе строителите на магистрали щяха да бъдат съдени задето хората извършват ПТП-та върху тях.

    Моят софтуер пробва да се закачи на два локални порта (за сервирането на web-а) – 80 и 18880. Вторият порт е за защита, тъй като не всеки ще може да отвори локален 80-ти порт (ограничени за сигурност или вече съществуващ софтуер там). След това с UPnP тези портове се опитват да бъдат отворени на локалният firewall (ако сте зад домашен маршрутизатор) автоматично. Това означава, че в 80% от случаите, без да се налага да правите каквото и да е, вие ще имате достъпен от интернет сървър на wikileaks. Няма нужда да знаете какво и как да си конфигурирате на firewall-а, за това.

    Как потребителите от Интернет биха използвали тази инфраструктура?

    Първо тези, които имат клиента инсталиран на своят компютър могат да се закачват локално – на порт 80 или 18880. Това е най-сигурният начин – изтегляте си клиента, и изчаквате да се синхронизира, след което се закачвате локално, а и доизграждате инфраструктурата на Wikileaks.

    Но не можем да очакваме всеки да инсталира клиента си локално за да достъпва Wikileaks. Трябва да можем да осигуряваме достъп и за тези, разполагащи само с web клиент.

    За целта трябва да можем да насочим browser-ите към IP адрес на клиент изпълняващ в момента web сървър. Тоест трябва да имаме DNS за даден домейн (wikileaks.ch ?) и конфигурация насочваща към IP адресите.

    Малък софтуер (скрипт за DNS от типа на PowerDNS) може да извлича всички сиидъри (пиъри) за Web-а от неговият хаш (по подобие на техниката, която използвам за анонсиране на съобщения). След което може да проверява бавно кой от тях има порт 80 отворен и анонсира правилно web информацията. След което проверените peers влизат в списък, на който при запитване по DNS връща IP на web сървъра. Може да се върне най-близкото IP към запитващият, по геогравски признак (разстояние между автономни системи – публична информация) или дори още по опростено да изважда от адресите този на запитващият и да връща този, който има най-малък резултат от операцията по абсолютна стойност.

    Така потребителите питащи за wikileaks.org например биха получавали най-близкият до тях работещ IP адрес, ако ще да е домашно PC. Ако то умре, автоматично (в рамките на до 15 мин) ще бъде анонсиран някой друг при запитване.

    Освен скорост, отказоустойчивост, тази схема не позволява лесно проследяване на web сървърите (и тяхното събаряне) освен ако не изпратиш DNS запитвания от всички мрежи където има такива сървъри (а това е невъзможно без предварителна информация).

    Така направената структура би имала над средната (за сегашните технологии и атаки) устойчивост като инфраструктура и би позволила истински дистрибутиран и децентрализиран клауд (ако съответният web сървър има стандартно API, това е достатъчно за да се постигне дефиницията).

    Но тясно място остава домейна на организацията, тъй като той е под централизиран контрол. DNS-а е най-слабият протокол в Интернет от гледна точка на сигурността, бутането му е лесно, а е самодостатъчно да унищожи над 90% интернета, който познаваме, но в частният случай на Wikileaks – тъй като повечето GTLD-та подлежат на контрол индиректно (все още) от MD на USA, и следователно (както видяхме с Wikileaks) домейните могат да бъдат бързо спирани, без необходимост да се доказва незаконност на дейността на сайта. Ако домейните бъдат спирани, повечето от клиентите няма да могат да се закачат към уеб сървърите, и така нейната достъпност значително се намалява.

    Слабостта на DNS е оръжие в ръцете на тези, които искат да заобикалят съдебните процедури и да разчитат на авторитарен механизъм на налагане на бързо решение. Точно и за това, след дълги и реално неуспешни лобизми на RIAA в телеком пакета в EU, DMCA в US и ACTA (от която отпадна задължителното изискване ISP-тата да блокират трафик и да съдействат на контент провайдерите преди съдебно решение), и неуспешните (на глобално ниво) обиколки сред ISP-тата за да бъдат подканени „те сами да решат“ да съдействат, както и проблемите, които се оформят от новите движения за мрежова неутралност в US и EU (които индиректно посочват, че блокирания на услуги ще изискват нещо да бъде обявено предварително за незаконно, което значи наличие на съдебно решение), това мотивира RIAA да се насочи към GTLD-тата с идеята да ги кара те да премахват домайни при оплакване, без чакане на съдебно решение (безкрайно интересният случай течащ в момента с rapidshare.com).

    В частният случай на моят клиент аз боря DNS проблема чрез 3 начина -

    • Предполагам, че Wikileaks ще работи с (наистина) независим GTLD (както те опитаха да напеавят мигрирайки към .ch домейн). Това прави изключително трудно спирането на услугата преди да тя да бъде обвинена, че извършва престъпление и то от съдебно решение (и дори тогава, то подлежи на обжалване по международните норми в Швейцария). Няма как Хилъри просто да каже „спрете домейна“ и това да стане.

    • Локален достъп до данните, ако си инсталираш клиента (ако нямаш достъп до някой сървър просто си инсталираш клиента и вече си имаш сървър)

    • Мултикаст DNS – новото развитие на DNS протокола, което на всичко отгоре се поддържа от много от съвременните операционни системи. Просто те запитват при DNS заявка и мултикаст група на порт 5353 (от там нататък всичко е същото) и много машини могат локално да отговорят кой обслужва този домейн. Моят клиент пробва да се биндне на порт 5353 за мултикаст DNS (дори ако там вече има нещо), оправя локалните hosts кешове, и ако намери bonjour (Multicast DNS услуга от Apple) я преконфигурира. Така дори да паднат международните DNS-и, локалните продължават да работят и да подават коректна информация. Стига да има по един „wikileaks“ клиент във всеки мрежов сегмент, и няма да има нужда от никакви GTLD-та, както и контрола върху информацията там. Спуфинг и флуудинг атаки не работят (ефекта им е само локален, евентуално) и системата става много по отказоустойчива, но най-вече децентрализирана и неконтролируема авторитарно

    Всичко описано тук го имам направено в python базиран торен клиент и web сървър, с буквално 300-400 реда код като концепция. Това, което се каня да разработя е хубав графичен интерфейс и да го пусна като демонстрационен клиент. Той няма за цел нищо друго освен демонстрация на идеята. Избрах python тъй като има лесен порт на ползваните от мен библиотеки, програмирането е бързо и е относително преносим, както и позволява близко коопериране с операционната система. Съжалявам, но Java не ми е сила, а C++ би изисквал повече време за разработката на концепцията. Ако реша да напиша реален клиент, ще бъде на C++, но концепцията трябва да е лесна за модификация.

    А самата идея е интересна. Тя позволява сериозна дистрибуция, отказоустойчивост и производителност при относително малко използвани (напълно домашни) ресурси дадени под наем от доброволци.

    Една подобна инфраструктура може да поддържа множество сайтове и дори приложения (които могат да се изтеглят като python плъгини и ъпгрейди по стандартният начин описан за обмен на файлове и съобщения). При дефиниране на стандартно API и Framework тя би могла да изглежда като напълно дистрибутирана клауд услуга, без гаранция за производителност (но без никаква цена за същесъвуването си и със значително завишена отказоустойчивост при произволни удари и атаки). Отделно клъстеризация чрез MPI API и дистрибутиране на web заявки децентрализирано от един клиент на друг може да се доразработи много лесно, тъй като всеки клиент може да научи къде са му съседите, и от там нататък с минимално протоколно разширение може да знае кой как е натоварен и да служи като локален разпределител на заявки. Чрез структуриран алгоритъм (подобен на DHT) може тези заявки макар с дистрибутирано локално редиректване да получат глобално синхронизирано контролиране, и като ефект всички услуги, които една клауд инфраструктура типично предлага днес, но направени в една стъпка по напред.

    Подобна инфраструктура би могла да обслужва и торент сайтове като thepiratebay или arenabg, по начин невъзможен за спиране (като инфраструктура) без значителна модификация на начина, по който службите оперират и то с много ограничен ефект.

    Недостатък обаче би било практическата невъзможност за рекламна печалба (не и върху моят клиент) от съответните организации, поради трудната възможност за създаване на контент и потребитело зависими реклами (заради архитектурата и стремежа към анонимност) и следователно липсва потенциал за комерсиален интерес, освен ако не се модифицират клиентите, така че да могат да се използват и за някаква форма на дистрибуция на реклама.

    При всички обстоятелства, такива системи предлагат доста голямо разширение на понятието и визията ни за това какво точно представлява една инфраструктура и как (и дали) тя може да се контролира въобще. Тази идея и демонстрира, че технологията позволява (и следователно не позволява) авторитивно налагане на мнение, разчитайки само на поддръжката на машините. Не можеш да изфилтрираш или да блокираш нещо лесно, нито да спреш на някой сървъра, задето не ти харесва. Щом има хора, които се интересуват от подобна услуга, тя ще съществува. Ако това е „неправилно и неморално“, то е редно хората да бъдат най-вече убедени в това, минимизирайки необходимостта от прилагане на сила, тъй като тя не би работила под никаква форма, когато подкрепата за „каузата“ е масова.