Пристрої для додавання матриь

В наш час одним з основних напрямків підвищення продуктивності комп’ютерів є розпаралелювання процесу обробки інформації впритул до елементарних операцій та децентралізація функцій пам’яті і перетворення інформації. Тому важливим у розвитку обчислювальної техніки і мікроелектроніки останніх років стало рішення задачі зв’язку між елементами на рівні : 1) кристалу – один вентиль поєднується з іншим в межах кристала; 2) підсистем – зв’язуються кристали і дискретні елементи; 3) систем – зв’язок між блоками, наприклад процесорами, запам’ятовуючими пристроями і пристроями вводу-виводу.

Присутні оптичним методам зв’язку властивості : висока швидкодія, низький рівень перехресних завад, відсутність ємнісних навантажень, можливість перепрограмування та інше – припускають переважне використання оптики у обчислювальній техніці і мікроелектроніці при розробках оптичних з’єднань в суперкомп’ютерах. В літературі описано велику кількість оптичних пристроїв для виконання арифметичних операцій з дискретними даними. Огляд їх архітектур наведено, наприклад в [13,14]. Найбільш перспективними серед них вважались архітектури оптичних обчислювальних пристроїв, що працюють в системі остачевих класів. Однак, так як по своїм властивостям система остачевих класів є проміжною між аналоговою і війковою системами числення, то їй властиві численні недоліки аналогових систем, наприклад, такі як відносно невеликі продуктивність, надійність і точність виконання операцій в зв’язку з застосуванням просторового чи часового інтегрування на фотоприймачі і необхідності перетворення сигналів з послідуючою їх дискретизацією. Все це ускладнює використання таких оптичних обчислювальних пристроїв для створення суперкомп’ютера.

В роботі [15] розглядаються можливі принципи побудови швидкодіючих арифметичних пристроїв, побудованих на напівпровідникових лазерах та керованих транспарантах. Шляхом просвічуваня керованого транспаранта лазером можливо реалізувати будь-які функції булевої алгебри, що являються повною системою функцій, і таким чином побудувати арифметичний пристрій. В цьому випадку кон’юнкція від n змінних реалізується шляхом просвічування лазерним променем n однокоміркових керованих транспарантів, диз’юнкція – шляхом зведення (фокусування) вихідних комірок одного n-коміркового керованого транспаранта. Розглянуто додавання двох чисел, тобто основна задача полягає у визначенні третього числа Е, розряди якого вказують на наявність чи відсутність переносу у відповідні розряди порозрядної суми.

Основною проблемою при реалізації цього суматора є необхідність високої прозорості керованих транспарантів, так як промінь світла послаблюється при проходженні m транспарантів у αm раз, де α – коефіцієнт прозорості.

Різка зміна відношення енергії на вході керованого транспаранта і енергії на вході фотоприймача накладає дуже жорсткі вимоги на стабільність і повторюваність параметрів керованих транспарантів і вимагає їх термостатування і стабілізації амплітуд керуючих сигналів .

Розглянутий суматор легко реалізується при малому m (наприклад, m = 8). В цьому випадку знижуються вимоги до керованих транспарантів і до умов їх роботи, спрощуються схеми керованих транспарантів, різко зменшується споживана потужність, за рахунок зменшення числа комірок і зменшення числа транспарантів на шляху променя. Тому достатньо перспективною є схема суматора, що складається з декількох байтових суматорів, поєднаних ланцюгом байтових переносів .

При цьому загальний час запізнювання складає:

clip_image002, (1.1)

де S – кількість байтів у числі;

τз.б. – запізнювання байтового суматора;

τф – час встановлення напруги на виході перетворювачів світло-напруга (τф < 10-9 с);

τт – час перемикання транспаранта (τт < 5∙10-9 с);

τ0 – час прольоту фотонів через транспарант (τ0 3∙10-11с).

Для 64-розрядного суматора τз = 12 ¸ 16 нс и робоча частота лежить в районі f = (30 ¸ 40 МГц). Споживана потужність такого суматора складає близько 10 Вт, лазери що опромінюють байтові суматори, мають мати потужність неперервного випромінювання близько 1 Вт.

Основним недоліком розглянутої схеми є аналоговий спосіб накопичення інформації на фотоприймачі, що вимагатиме додаткового аналого-цифрового перетворення, отже схема має низьку точність обробки порівняно з цифровою точністю.

З метою усунення зазначених недоліків при виконанні математичних і логічних операцій оптичними методами і більш повного використання їх переваг у [21] пропонуються нові цифрові методи побудови оптичних обчислювальних пристроїв, базовані на парафазному двійковому представленні інформації. Вони дозволяють досягти високої точності, продуктивності і завадостійкості обчислень при операціях з числами з фіксованою точкою, причому позитивні доданки представляються в прямому коді, а негативні в доповняльному.

Операція додавання двійкових парафазних кодів здійснюється включно з розрядами знаків на основі таких правил: 01 + 01 = 01; 10 + 01 = 10; 01 + 10 = 10; 10 + 10= 10 01.

Одиниця переносу, що виникає в останньому випадку, повинна бути додана до суми цифр, що утворилася в сусідньому старшому розряді. У суматорі використане наступне правило переносу: якщо в результаті порозрядного підсумовування утворилася група одиниць, розташованих поруч, і в молодший розряд цієї групи надходить перенос 10, то він переводить всі одиниці цієї групи в нулі, а в найближчий за рядом одиниць 01 у 10.

Принцип побудови цифрового оптичного сторінкового суматора показано на рисунку 1.1.

clip_image003

Рисунок 1.1 – Схема оптичного сторінкового сумматора

Блоки введення 1, 2 призначені для введення операндів в оптичний суматор у вигляді оптичних або електричних сигналів. Блок розкладання зображень 3 призначений для виділення і направлення на свої роздільні виходи 3-1…3-3 зображень, що містять в однойменних розрядах обох сторінок операндів відповідно тільки одиниці (сторінка А), різнойменні двійкові знаки (сторінка В) або тільки нулі (сторінка С). Блок розведення зображень 10 призначений для розмноження вхідного зображення. Блок додавання одиниць 11 призначений для додавання однойменних розрядів сторінок операндів, що містять тільки парафазні двійкові одиниці. Блок аналізу переносу 14 призначений для виявлення груп одиничних розрядів сторінки В, в які надходять одиниці переносу із сусідніх більш молодших груп одиниць сторінки А. Блок розведення зображень 15 призначений для розмноження вхідного зображення. Керований блок розведення зображень 16 призначений для поділу зображення сторінки В на сторінку В0 (вихід 27-1), у групу розрядів якої не здійснюється перенос одиниці, і на сторінку В* (вихід 27-2), у групи розрядів якої здійснюється перенос одиниці зі сторінки А. Блок перетворення одиниць 17, служить для перетворення всіх груп розрядів сторінки В* у зв’язку з переносом у них одиниці переносу зі сторінки А. Блок зведення зображень 20 із входами 30-1…30-4, відповідно з 1 по 4 призначений для об’єднання зображень сторінок результатів, отриманих у блоках 3, 11, 16, 17 у зображення сторінки суми вхідних операндів.

Описаний вище принцип побудови оптичного цифрового суматора пояснюється схемотехнічним варіантом такого пристрою на елементній базі волоконної і інтегральної оптики.

При роботі суматора електричні сигнали сторінок доданків надходять на матриці парафазних лазерних діодів блоків 1, 2, перетворяться в оптичні і поступають на входи логічних вузлів 4-6 блока 3. Після виконання логічних операцій і фільтрації оптичних сигналів фільтрами 7-9 на виходах 3-1…3-3 блоку 3 з’являться відповідно сторінки оптичних сигналів парафазних одиниць – сторінки А і В і сторінка оптичних сигналів парафазних нулів – сторінка С. У сторінках А, В і С кожен оптичний парафазний сигнал відповідає наявності в однойменних розрядах обох вхідних сторінок доданків відповідно тільки одиниць, різнойменних двійкових знаків і тільки нулів.

Розгалуджувачем 10 оптичні сигнали сторінки А розмножуються і направляються по каналу 22-1 на вхід блоку додавання одиниць 11, а по каналіу 22-2 на вхід блоку аналізу переносу 14. Розгалуджувач 12 і об’єднувач 13 блоку додавання одиниць оптично зв’язані таким чином, що кожен парафазний оптичний сигнал з виходу 23-1 переходить у найближчий старший парафазний розряд входу 24-1, а кожен оптичний сигнал старшого парафазного напіврозряду виходу 23-2 переходить в однойменний молодший парафазний напіврозряд входу 24-2. При цьому потужність оптичних сигналів на вході 24-1 повинна бути більше, ніж на вході 24-2. Отриманий на виході об’єднувача 13 результат додавання одиниць направляється на вхід 30-1 об’єднувача 20.

На входи блока аналізу переносу 14 одночасно по каналах 22-2 і 26-1 надходять оптичні сигнали сторінок А і В, а на виході з’являються керуючі сигнали, що відповідають тільки тим розрядам сторінки В, у які здійснюється перенос одиниці із найближчого одиничного розряду сторінки А. Керуючі сигнали з виходу 25 блоку 14 надходять на керований блок розведення 16, що направляє оптичні сигнали через розгалуджувч 15 із блоку 3 у канал 27-2 (сторінка В*), а інші сигнали (сторінка В°) безпосередньо по каналу 27-1 надходять на вхід 30-3 об’єднувача 20.

Виконання операцій над сторінкою В* блоком перетворення одиниць 17 пояснюється так. Розгалуджувач 18 і об’єднувач 19 блоку 17 оптично зв’язані таким чином, що кожному парафазному розрядові на виході 28-1 відповідає найближчий старший парафазний розряд на вході 29-1, а кожному напіврозряду на виході 28-2 відповідає найближчий молодший напіврозряд однойменного розряду на вході 29-2. При цьому потужність Р оптичних сигналів на вході 29-2 повинна бути більше потужності сигналів на вході 29-1. Результат направляється на вхід 30-2 об’єднувача 20.

Оптичні сигнали нулів сторінки С з виходу 3-3 безпосередньо надходять на вхід 30-4 об’єднувача 20. При цьому повинне дотримуватися наступне співвідношення потужностей оптичних сигналів: Р29-2 > Р29-1 = Р24-1> > Р24-2 = Р30-3 = Р30-4.

Сторінки оптичних сигналів, що надійшли на вхід об’єднувача 20, з’єднуються їм у єдину вихідну сторінку оптичних сигналів таким чином, що сигнали одиниць переносу накладаються на менш потужні сигнали молодших парафазних розрядів сусідніх сторінок і в цих розрядах з’являються оптичні сигнали парафазних одиниць. Отримана на виході об’єднувача 20 сторінка оптичних сигналів є вихідною сторінкою суматора.

Час Tс, за який цим методом можливо додати дві сторінки операндів, кожна з яких складається з n ´ m парафазних двійкових знаків, можливо оцінити по формулі:

clip_image005, (1.2)

де τл, τэ, τф – час спрацювання лазерного діода, електронних елементів і фотоприймача відповідно;

τрозп – час розповсюдження оптичних сигналів.

Тоді продуктивність пристрою, який працює по даному принципу:

clip_image007, (1.3)

де k – розрядність слів в сторінці.

З формул (1.2, 1.3) випливає, що при збільшенні розмірності сторінок, які можуть оброблятися такими суматорами, час їх додавання не збільшується, а продуктивність росте пропорційно збільшенню кількості слів в сторінці.

Так, вважаючи в формулах (1.2, 1.3) τл = τэ = τф = 10-9­ с, τрозп = 0,2 ∙ 10-9 c при довжині оптичного шляху порядку 10 см і n = m = k = 64, отримаємо, що дві сторінки з такою розмірністю можуть бути просумовані за час T = 3∙10-9 с з продуктивністю П = 2∙1010 опер/с, а при n = 512, m = 1024, k = 64 отримуємо, що при тому ж часі додавання 3∙10-9 c продуктивність може досягати 2∙1012 опер/с.

Проте, суттєвим недоліком парафазної арифметики є її надлишковість.

Найбільш глибокі дослідження принципів побудови цифрових паралельних пристроїв для додавання додатних матриць (багаторівневих зображень), які включають розгляд впливу форми представлення числа в двійковій системі числення (рядкове, стекове та символьне кодування) на ефективність структури процесора приведено в [16]. В цій роботі віддано перевагу стековому кодуванню з огляду на мінімізацію числа тактів розрахунку і спрощення синтезованих на його основі структур обробки матриць, у тому числі картинного суматора. Обмеження структурної швидкодії цього блоку викликано протікаючими в різний час процесами формування картин суми та переносу. Ця властивість характеризує і інші синтезовані на подібних принципах пристрої [17-19]. Так в роботі [17] основним операційним елементом процесора являється арифметико-логічний пристрій (АЛП), а саме просторово-неперервний АЛП (ПАЛП). На відміну від традиційних АЛП, що оперують паралельно зі всіма розрядами операндів, в ПАЛП виконується послідовна обробка окремих бінарних операндів паралельно по всьому зображенню.

clip_image010

Рисунок 1.2 – Структурна схема просторово-неперервного процесора

На структурній схемі процесора на основі модулятора ”Фототитус” (див. рисунок 1.2) сигнал clip_image012 – являється сигналом керування модулятором, clip_image014 і clip_image016 – величини зсуву операнда, clip_image018 і clip_image020 – адрес операнда, clip_image022 – сигнали керування голографічного оперативного запам’ятовуючого пристрою (ГОЗП).

Оптоелектронний модулятор ”Фототитус” має здатність зберігати операнд, додавати і віднімати просторово-неперервні багаторівневі зображення, дозволяє реалізовувати порівняно прості логічні пристрої, що виконують операції інверсії, диз’юнкції та кон’юнкції. Дані операціі створюють функціонально-повну систему логічних операцій, яка є достатньою для реалізації багатьох алгоритмів обробки зображень. Пристрій працює з частотою 1000 операцій/с. Однак найбільш суттєвий недолік таких суматорів – відсутність можливості обробки знакозмінних матриць.

Метою роботи [20] є розгляд можливості створення цифрового оптоелектронного процесора багаторівневих зображень, реалізуючого алгебраїчне додавання знакозмінних матриць (з можливістю їх цифрового часового накопичення), базуючись на принципах стекового кодування.

При представлені вхідної інформації в вигляді 2k-рівневих зображень розмірністю N ´ M вона обробляється розрядними зрізами, починаючи з нульового, як масив N ´ M операндів розрядністю K чи як послідовність зображень Х={X(K-1),…,X(k),…,X(0)}, при цьому clip_image024, де {Ait}(k) – двійкова матриця, для якої clip_image026, t = const.

Запис, зберігання і зсув послідовності зображень Х в t-м циклі алгебраїчного додавання виконується при використанні двовимірного стекового оперативного запам’ятовуючого пристрою (ОЗП1), а послідовність зображень Z (де clip_image028), записується, зберігається і зсувається в двовимірному стековому ОЗП2. Знакова матриця чергового масиву доданків {Ait}(K-1), тобто вміст К-го розряду двовимірного ОЗП1, дублюється в елементі пам’яті ЕП1 картинного типу, а знакова матриця поточної суми {Sit}(K-1) (тобто вміст К-го розряду двовимірного стекового ОЗП2) – в елементі пам’яті ЕП2 картинного типу. Також у склад АЛП входять суматор См, інверсні оптичні керовані транспаранти ОКТ1, ОКТ2, ОКТ3 і світлооб’єднувальний вузол (рисунок 1.3).

clip_image029clip_image030clip_image032

Рисунок 1.3 – Структурна схема цифрового оптоелектронного процесора багаторівневих зображень

У процесі виконання операції алгебраїчного додавання перед кожним циклом вміст елемента пам’яті ЕП2 картинного типу обнулюються, виходячи з цього при використанні інверсного ОКТ2 в АЛП, на керуючий вхід якого надходить інформація від елемента пам’яті ЕП2 картинного типу, інформація передаєтся без змін протягом усього циклу додавання із ОЗП1 на вхід другого доданку суматора См АЛП. Під час проходження информації з ОЗП1 через інверсний ОКТ1 АЛП виконується інвертування в i-х комірках k-го розрядного зрізу (i=1, 2, …, N clip_image034 M; k = 0, 1, …, K-2) при наявності одиниці в i-х комірках знакової матриці {Аti}(К-1) в елементі пам’яті ЕП1 картинного типу. Розглянуте перетворення в інверсному ОКТ1 виконується на (К-1)-х тактах циклу додавання. Перед К-тактом виконується обнулення елемента пам’яті ЕП1 картинного типу. Це дає можливість (K-1)-й розрядний зріз з ОЗП1 без змін пропустити через інверсний ОКТ1 на вхід першого доданку суматора См АЛП, тому що знаковий розряд при додаванні не інвертується .

Для формування одиниці або нуля, необхідних для перетворення інформації в i-й комірці нульового розрядного зрізу використовується інверсний ОКТ3 АЛП. Оскільки у вихідному стані (перед кожним циклом додавання) на виході переносу суматора См АЛП знаходиться информація у вигляді нульової матриці {Рti}(0), то, подаючи на керуючий вхід інверсного ОКТЗ АЛП інформацію у вигляді знакової матриці {Аti}(К-1) з виходу елемента пам’яті ЕП1 картинного типу, можна сформувати на вході переносу суматора См АЛП матрицю, у i-й комірці якої зафіксована одиниця, якщо в i-й комірці знакової матриці в елементі пам’яті ЕП1 картинного типу знаходиться одиниця, тобто якщо знак i-го операнда від’ємний.

При виконанні K-го такту поточного циклу алгебраїчного додавання на вхід синхронізації елемента пам’яті ЕП2 подається тактовий сигнал, що дозволяє записати в нього знакову матрицю поточної суми {Sti}(К-1). Якщо процес додавання не завершений і необхідно просумувати наступний масив операндів {Аt+1i}, то виконується обнулення елемента пам’яті ЕП2 картинного типу і АЛП.

Таким чином, результат додавання двох знакозмінних матриць сформований і представлений у доповняльному коді. При необхідності можна організувати процес переведення результату обчислень з доповняльного в прямий код.

Тривалість циклу алгебраїчного додавання двох 2k-рівневих зображень займає час Тдод = Т1 + …+Тk = kT, де Т1,…,Тk – тривалість тактів циклу додавання; Т = Т1 = Т2 = … = Тk.

Швидкодія розглянутого процесора визначається в основному швидкодією стекових ОЗП1, ОЗП2 і арифметико-логічного пристрою АЛП, оскільки тривалість такту Т циклу додавання і такту Т¢=Т1¢ = … = Тk¢ циклу перетворення визначається, як правило, часом запису (зсуву) tзп ОЗП1, ОЗП2 і часом додавання tдод АЛП. При розглянутому варіанті реалізації характерним є співвідношення tдод ≤ 10 τ, а для часу запису (зсуву) tзп ОЗП1, ОЗП2 – співвідношення tзп ≤ 3τ, де τ – тривалість затримки елементної бази.

На орієнтовну оцінку таких параметрів, як продуктивність, швидкодія і розмірність поля, що обробляється суттєво впливає елементна база. Так, наприклад, при реалізації регістра зсуву, що використовується в основі стекової пам’яті а також ОКТ і суматора на рідкокристалічних транспарантах (РК ОКТ), що характеризуються розмірністю N ´ M = 1000 ´ 1000 з кроком просторової дискретизації приблизно 50 мкм, часом циклу запис – стирання (10-3 – 10-4) c, чутливістю (50 — 500) мкВт/см [13], можливо досягнути для К=16 і N´M = (512 ´ 512) елементів зображення продуктивності процесору (при додаванні знакозмінних матриць без врахування циклу перетворення) близько 1,3 ´ 107 слів/с.

В процесі реалізації основних функціональних вузлів процесора на матрицях оптичних бістабільних елементів, наприклад на SEED-пристроях (час перемикання 1нс; енергія перемикання 1пДж; площа елемента 100 мкм2; К = 16 і N´M = 32 ´ 64 елементів зображення) максимальна продуктивність процесора при додаванні знакозмінних матриць (без врахування циклу перетворення) складає приблизно 1010 слів/с. Подальше удосконалення елементної бази, зокрема підвищення швидкодії РК ОКТ і зменшення управляючої оптичної потужності бістабільних елементів, дозволить досягти продуктивності 1010 – 1012 слів/с при обробці багаторівневих зображень на запропонованому цифровому оптоелектронному процесорі.

Основний недолік – не дозволяє обробляти числа у формі з плаваючою комою, що зменшує діапазон вхідних даних і за рахунок цього обмежується рівень продуктивності.

У розвиток цих методів у роботі [13] пропонується алгоритм, цифровий принцип і схемотехнічний варіант побудови нового класу оптичних обчислювальних пристроїв для виконання алгебраїчного додавання сторінок парафазно-кодованих слів з плаваючою комою в оптоелектронному суперкомп’ютері. Представлення в оптоелектронному суперкомп’ютері інформації словами з плаваючою комою у порівнянні з представленням слів з фіксованою комою дозволяє уникнути масштабування вхідних слів і при тій же довжині розрядної сітки збільшити діапазон і точність представляємих слів, і таким чином підвищити точність і надійність оптичних обчислень. Завдяки широкому діапазону переповнення розрядної сітки в процесі обчислень практично виключається, а відносна точність представлення чисел на всьому діапазоні їх зміни залишається практично постійною.

Функціональну схему запропонованого принципу побудови сторінкового оптичного суматора з плаваючою комою показано на рисунку 1.4.

На даній схемі 1, 2 – вхідні оптичні регістри; 1-1, 2-1 – виходи порядків; 1-2, 2-2 – виходи мантис; 3, 4, 11, 12, 14, 15 – оптичні вентилі; 3-1, 3-2, 4-1, 4-2, 11-1, 11-2, 12-1, 12-2, 14-1, 14-2, 15-1, 15-2 – входи вентилів; 5 – оптичний суматор порядків із входами 6-1, 6-2 і виходами знаків і порядків 7-1, 7-2; 8 – оптичний суматор мантис із входами 8-1…8-3; 9 – оптичний блок додаткових одиниць; 10 – оптичний блок аналізу знаків, у якому 10-1 і 10-2 –відповідно одиничний і нульовий виходи; 13 – оптичний зсуваючий регістр з інформаційним 13-1 і керованим 13-2 входами; 16 – оптичний нормалізатор; 17 – вихідний оптичний регістр.

clip_image035

Рисунок 1.4 – Схема оптичного сторінкового суматора з плаваючою комою

Розглянувши функціональне призначення кожного блоку суматора, пояснимо принцип його побудови.

Вхідні оптичні регістри 1, 2 призначені для введення в суматор сторінок доданків (операндів) у вигляді оптичних парафазних сигналів, у тому числі з перетворенням їх з електричних. При електричному вводі сторінок операндів регістри можуть складатися із зв’язаних між собою електронної пам’яті, наприклад, на регістрах і матриці лазерних діодів. При оптичному введенні на вході регістрів додатково розташовується матриця фотоприймачів.

Оптичні вентилі 3, 4, 11, 12, 14, 15 можуть бути виконані на основі безлінзових схем, а в якості оптичних суматоров порядків 5 і мантис 8 необхідно застосувати схеми, що здатні автоматично (без додаткових тимчасових витрат) враховувати переноси між розрядами.

Оптичний блок додаткових одиниць 9 округляє результати алгебраїчного додавання сторінок операндів і може складатися, наприклад, з оптично зв’язаних між собою лазерного діода, фокона і маски, стовбця парафазних одиниць.

Оптичний блок аналізу знаків 10 формує зі знакових розрядів суматора порядків 5 керуючі сигнали для оптичних вентилів 3, 4; 11, 12 і 14, 15 і може бути виконаний, наприклад, у вигляді маски.

Оптичний зсуваючий регістр 13 здійснює одночасний паралельний зсув операндів на необхідне число розрядів вправо або вліво за один такт.

Оптичний нормалізатор 16 необхідний для нормалізації результату обчислення.

Вихідний оптичний регістр 17 служить для формування, збереження і видачі результату. Він може представляти собою послідовно з’єднані матриці фотоприймачів і електронних регістрів при електричному виході або додаткову матриці лазерних діодів на вході при оптичному виході.

Оптичний цифровий суматор з плаваючою комою працює наступним чином. Вхідні сторінки операндів надходять по входах 1 і 2 відповідно на вхідні оптичні регістри 1 і 2. Порядки слів з виходів 1-1 і 2-1 надходять на оптичний суматор порядків 5, що з порядків слів першої сторінки віднімає відповідні порядки слів другої сторінки операндів.

Оптичні сигнали знакових розрядів сторінки різниці порядків операндів через оптичний блок аналізу знаків 10 надходять в якості керуючих на входи 11-2 і 12-1 відповідних оптичних вентилів 11 і 12 і, відповідно до вищеописаного алгоритму на вхід 13-1 оптичного зсуваючого регістра 13 з виходів 1-2 і 2-2 відповідних регістрів 1 і 2 надходять мантиси слів першої або другої сторінки операндів. Таким чином у регістрі 13 формується сторінка мантис, що підлягає нормалізації.

Оптичний зсувний регістр 13 виконує одночасний і паралельний зсув усіх мантис, причому значення зсуву кожної мантиси визначається відповідним сигналом на вході 13-2. Отримана результуюча сторінка з виходу регістра 13 надходить на вхід 8-1 оптичного суматора мантис 8, на другий вхід якого 8-2 приходять нормалізовані мантиси операндів з регістрів 1, 2 через вентилі 3, 4, на входи яких 3-2, 4-2 подаються інверсні керуючі сигнали з блоку 10.

Суматор мантис 8 виконує алгебраїчне додавання мантис сторінок операндів з вирівняними порядками (причому в додатковий розряд суматора 8 із блоку 9 подається стовбець додаткових одиниць для округлення результату), а результат надходить на блок 16 для нормалізації. На цей же оптичний нормалізатор 16 з регістрів 1 і 2 через вентилі 14, 15 надходить сторінка відповідних порядків. При цьому на входи 14-2 і 15-2 вентилів 14, 15 подаються керуючі сигнали з 10, що і забезпечують об’єднання мантис з відповідними порядками. Отриманий результат обчислення алгебраїчних сум передається на вихідний регістр 17.

Представлений схемотехнічний варіант сторінкового оптичного цифрового суматора, може бути використаний в оптоелектронних суперкомп’ютерах з підвищеною точністю і надійністю обчислень різного призначення.

Час Т, за який запропонований суматор може додати дві сторінки операндів, кожна з яких включає n´m парафазних двійкових знаків, можливо оцінити за формулою:

clip_image037, (1.4)

де τр, τс, τзр, τн, τв – відповідно час спрацювання оптичного регістра, оптичного суматора, зсуваючого регістра, оптичного нормалізатора, оптичного вентиля.

Тоді продуктивність суматора, працюючого на даному принципі:

П = n ´ m / (qT), (1.5)

де q –розрядність слів.

З формул (1.4, 1.5) випливає, що при підвищенні розмірності сторінок час їх підсумовування не змінюється, а продуктивність при цьому зростає пропорційно збільшенню числа слів на сторінці.

Так, вважаючи в формулах (1.4, 1.5) τр= τс= τзр= τн= τв=10-9 с, n = 32, m = 64, q =32, отримуємо що дві сторінки з такою розмірністю можуть бути підсумовані за час Т = 6∙10-9 с, при цьому продуктивність досягає П = 1010 операцій додавання в секунду, а при n = 512, m = 1024, q = 32 при тому ж часі додавання продуктивність досягає 2∙1012 операцій додавання в секунду, чи при перерахунку на байти може досягати П = 1013 байт операцій додавання в секунду.

Основні параметри розглянутих пристроїв наведено в таблиці 1.1. Проаналізувавши дану таблицю, можна зробити висновок, що в оптико-електронних пристроях з плаваючою комою при тій же кількості розрядних зрізів, відведених для запису кодів матриць даних, діапазон чисел значно ширше, ніж в оптико-електронних пристроях з фіксованою комою. Завдяки широкому діапазону чисел переповнення розрядної сітки в процесі обчислень практично виключається, а відносна точність подання чисел на всьому діапазоні їх змінювання залишається майже постійною.

Параметри оптичного цифрового суматора з плаваючою комою, побудованого на вищенаведених принципах, найкраще узгоджується з параметрами інших перспективних обчислювальних і пошукових пристроїв, які розробляються.

Такий суматор може бути використаний для створення оптоелектронного суперком’пютера з підвищеною точністю і надійністю обчислень для високопродуктивної обробки великих обсягів різної інформації.

Параметри відомих пристроїв додавання матриць

Назва присторою Розмірність NxM, елементів Розряд-ність

L, розр

Час додав. матриць в тактах (с) Продук-тивність,

опер/с

Точність, діапазон чисел Форма представл. даних Поси-лання на літе-ратуру
Пристрій для додавання двох чисел 1х1 64 12–16 ∙ 10-9 1,2 ∙ 107 Аналогова Фіксована [15]
Пристрій для додавання матриць (парафазне кодування) 512×1024 64 3 ∙ 10-9 2∙1012 Цифрова,

clip_image039clip_image041,n — кіль-кість розрядів для фіксації значущої час-тини дробу

Фіксована [21]
Пристрій для додавання знакозмінних матриць 32х64 16 10-9 1010 - 1012 Цифрова, clip_image042clip_image041[1],n — кіль-кість розрядів для фіксації значущої час-тини дробу Фіксована [20]
Пристрій для додавання матриць з плаваючою комою 512×1024 32 6 ∙ 10-9 106 MFLOP Цифрова,clip_image044к – кількість розрідів по-рядку числа Плаваюча кома [13]

Оптичний цифровий суматор з плаваючою комою характеризується порівняно високими параметрами точності обчислень, забезпечуючи при цьому середню обчислювальну швидкодію на рівні 106 MFLOP/с, яка відповідає вимогам, висунутим до сучасних спецпроцесорів паралельної обробки матриць, враховуючи їх застосування для задач обробки сигналів і зображень.

Оставьте комментарий к статье