Друге життя в віртуальних світах

Перша стаття, написаная Карлом Симборський, називається «Масштабоване розподіл користувацького контенту для глобальних багатокористувацьких онлайнових світів» (Scalable User Content Distribution for Massively Multiplayer Online Worlds).

Глобальні розраховані на багато користувачів онлайнові ігри (Massively Multiplayer Online Game, MMOG) стають одними з найбільш популярних багатокористувацьких мережевих додатків. Приклади MMOG є EverQuest компанії Sony і World of Warcraft від Blizzard. У них забезпечується структурована віртуальне середовище, в якій гравці можуть взаємодіяти з іншими гравцями, переслідуючи спільні цілі або конкуруючи, удосконалюючи тим самим свої суспільні зв'язки.

Глобальні розраховані на багато користувачів віртуальні світи (Massively Multiplayer Online World, MMOW) представляють собою окремий клас багатокористувацьких мережевих додатків. Прикладами сервісів MMOW можуть служити There компанії Makena Technologies і Second Life компанії Linden Lab. На відміну від MMOG сервіс MMOW включає в себе механізми, які дозволяють не тільки розробникам, але і гравцям визначати нові оригінальні об'єкти і поведінка персонажів.

Однак технічні вимоги, що виникають при підтримці контенту, що створюється користувачами, перевершують вимоги до пропускної здатності сервера, клієнта і мережі, що пред'являються більшістю успішних MMOG. Автор аналізує цю проблему, порівнюючи навантаження на пропускну здатність мережі при використанні MMOG і сервісів MMOW. Оцінка обсягу мережевого трафіку на стороні клієнта показує, що наявність користувацького контенту в MMOW навантажує мережу в десять разів більше, ніж MMOG, які не підтримують створення контенту користувачами. Пропускна здатність мережі - критичний фактор, який дозволить масштабувати сервіси MMOW на велике число користувачів.

Пропонується підхід, що дозволяє знизити рівень вимог до пропускної здатності мережі з боку серверів і клієнтів MMOW при поширенні або оновленні контенту, створеного користувачами. Пропонована архітектура включає в себе три механізму. Перший ототожнює призначений для користувача контент ні з індивідуальними сутностями або файлами, а з колекціями, ідентифікованими зведеними описувачем. Другий механізм - процедура узгодження даних, що дозволяє призначеному для користувача клієнту управляти передачею необхідного контенту від серверів MMOW до цього клієнту. У третьому механізмі використовується ієрархія сервісів завантаження, реалізована на основі сервісу CDN (Content Delivery Network). Зведені описатели забезпечують інфраструктуру для відображення користувацького контенту в об'єкти, якими може керувати CDN. Ці поняття є основою завантаження розподіленого користувацького контенту, яка потенційно дозволяє масштабувати сервіси MMOW при зростанні числа гравців.

Другу тематичну статтю - «Second Life і нове покоління віртуальних світів» (Second Life and the New Generation of Virtual Worlds) - представили Санджив Кумар, Джатін Чхугані, Чанг Кью Кім, Дей Хьюн Кім, Ентоні Нгуєн, Прадід Дюбей, Крістіман комбайнів і Янг мін Кім.

Віртуальний світ - це імітована комп'ютерами середовище, в якому користувачі можуть мешкати і взаємодіяти з іншими користувачами або як з ними самими, або через програмних агентів або через графічні уявлення, звані аватарами. У віртуальному світі можуть бути присутніми як двійники об'єктів реального світу, так і об'єкти і явища, які не мають прямих аналогів в реальному світі.

Через обмеженість обчислювальної потужності і мережевих ресурсів сучасних машин віртуальні світи часто реалізуються з використанням двовимірної графіки зі спрощеними алгоритмами. Це особливо вірно для віртуальних світів, орієнтованих на застосування мобільних пристроїв. Однак в розрахунку на більш потужні комп'ютери розробники віртуальних світів використовують вже тривимірну графіку і більш складні алгоритми.

Тривимірні віртуальні світи можна грубо розділити на онлайнові ігри та «метавсесвіт» (metaverse). Онлайнові ігри існують вже більше десяти років. Деякі з них, наприклад, «стрілялки» типу Quake розроблялися в розрахунку на невеликі групи спільно грають користувачів (до десяти чоловік). Глобальні розраховані на багато користувачів онлайнові ігри розроблялися з урахуванням можливості масштабування до тисяч одночасних учасників гри.

При наявності географічно розподілених в Internet користувачів, онлайнові ігри в основному спираються на застосування моделі «клієнт-сервер», коли кожен користувач запускає клієнтську програму, що з'єднується з однією або декількома машинами, на яких виконується серверна програма. Сервер відповідає за управління взаємодією кількох персонажів і об'єктів у віртуальному світі, а також комунікаціями з клієнтом. Отже, вимоги до обчислювальної потужності сервера пропорційні розміру віртуального світу і числу клієнтів, одночасно підключених до даного сервера.

Для реалізації сервера, що підтримує MMOG з тисячами одночасних гравців (наприклад, EVE Online або World of Warcraft), потрібно кластер машин. Такий кластер розбивається на «Шарден» (shard), кожен з яких підтримує конкретний екземпляр даного віртуального світу. На початку кожної своєї ігрової сесії гравець вибирає шард і протягом даної сесії взаємодіє тільки з іншими гравцями в цьому Шардена.

Метавсесвіт є повністю «імерсивні» (забезпечують реальний ефект присутності) віртуальними просторами, істотно відрізняються від онлайнових ігор. Перш за все, метавсесвіт є окремим нерозривний світ, в якому користувачі можуть безперешкодно мандрувати без заздалегідь визначених цілей. Для цього потрібні складні комунікаційні протоколи, масштабована ємність сховищ даних і автоматичне балансування навантаження на серверах, що імітують реальний світ. Масштаб і складність MMOG на порядки поступаються відповідним показникам метавсесвіт.

У онлайнових іграх весь контент генерується фахівцями. Це обмежує можливості користувачів, зате гарантується якість контенту і його доставка в реальному часі. У метавсесвіт майже весь контент генерується користувачами і знаходиться в їх розпорядженні. Оскільки багато користувачів мало розуміють в тому, як їх рішення впливають на продуктивність, в метавсесвіт необхідно використовувати методи автоматичної оптимізації, яка в MMOG виконується фахівцями, які розробляють контент.

Метавсесвіт значно більші будь-якої окремої онлайнової гри. У них часто є економіка, що розвивається, користувачі купують і продають віртуальні об'єкти, включаючи землю, а також продукти реального світу. У деяких метавсесвіт загальний обсяг щоденних угод може досягати мільйонів реальних доларів.

Контент метавселенной - динамічний, оскільки користувачі безперервно створюють і змінюють об'єкти. На відміну від цього, онлайнові ігри грунтуються на статичних схемах, які представляють весь контент віртуального світу на клієнтській машині. Під час гри сервер MMOG обмінюється тільки відносно невеликими порціями даних - в основному, даними, що вводяться користувачами, і даними, що характеризують місце розташування персонажів.

Метавсесвіт завоювали популярність у мільйонів користувачів по всьому світу. Розширюється набір метавсесвіт, що застосовуються при організації соціальних мереж, в середовищах колективної роботи, роздрібної торгівлі, віртуальному туризмі, маркетингу, при навчанні поведінки в надзвичайних ситуаціях і в мистецтві, часто називають 3D-Internet.

Доступ до деяких віртуальні світи надається лише окремим групам користувачів. Так, компанія Forterra Systems створює та підтримує приватні віртуальні світи на основі своєї платформи On-Line Interactive Virtual Environment. Ці метавсесвіт орієнтовані на навчання персоналу або на підтримку колективного прийняття рішень, і в них зазвичай відтворюються розташування реального світу.

Однак основна частина метавсесвіт відкрита для всіх бажаючих і служить засобом підтримки соціальних мереж, комерції, освіти і розваг з деякими елементами фентезі. Перша метавсесвіт, CitySpace, була представлена на конференції SIGGRAPH в 1993 році і підтримувалася до 1996 року. З тих пір з'явилося безліч метавсесвіт, до числа яких відносяться Active Worlds і There.

В даний час найбільш популярною метавселенной є Second Life, в якій у віртуальній формі присутні багато корпорацій, університети, міста, посольства, творчі працівники та прості люди. На рис. 1 показані скріншоти трьох регіонів Second Life: футуристичний місто Miramare, шведське посольство розробки Swedish Institute і острів, створений міжнародним рекламним агентством Edelman.

Обчислювальні та комунікаційні вимоги метавсесвіт значно перевершують вимоги онлайнових ігор. Наприклад, один сервер може обслуговувати кілька тисяч клієнтів MMOG, але лише близько сорока клієнтів Second Life. Для кращого розуміння цього нового виду додатків автори зробили детальний аналіз архітектури Second Life, а також технічних вимог цієї метавселенной до клієнтів, серверів і мережі. На відміну від традиційних онлайнових ігор, метавсесвіт повинні генерувати динамічний контент, який в основному створюється користувачами і постійно модифікується. Як показав проведений аналіз, це викликає значні вимоги до клієнтів, серверів і мережі. У міру того, як віртуальні світи будуть підтримувати все більше користувачів і типів взаємодій, а також забезпечувати кращу реалістичність, рівень цих вимог буде зростати на порядки величин. Тому метавсесвіт гратимуть важливу роль в розробці майбутніх комп'ютерних систем.

Авторами статті «Діляться все: проблема систем зі спільним використанням даних» (Everybody Share: The Challenge of Data-Sharing Systems) є Кен Сміт, Льон Селігман і Віпін Сварап.

Фізичні особи, комерційні компанії та держустанови спільно використовують гігантські обсяги даних із застосуванням найрізноманітніших технологій: Web-сервісів, сховищ даних, порталів, каналів RSS і тимчасових систем поділу файлів. Спільне використання даних в науці привело до появи нової дисципліни - науки, керованої даними (data-driven science), в якій дослідники використовують великі масиви даних, такі як бази даних геномів і цифрові обсерваторії, для генерації і перевірки нових гіпотез. Середовища спільного використання даних значно розширюються. Наприклад, через три роки після утворення тимчасової мережі Gnutella в ній були присутні 100 тис. Вузлів з 20 млн файлів.

На тлі успішного спільного використання даних підвищується рівень вимог до засобів їх обробки. На думку членів антитерористичної комісії уряду США, недосконале спільне використання даних є ключовою перешкодою для запобігання терористичних атак. Основна проблема діяльності по боротьбі зі спалахами пандемій полягає в наданні можливості спільного використання даних біоконтролю урядовим установам, госпіталів та інших організаціям.

У той же час спільне використання даних стає джерелом серйозних конфліктів. Користувачі тимчасових систем поділу файлів продовжують конфліктувати з індустрією розваг, а зусилля уряду щодо спільного використання інформації про тероризм викликають протести з боку захисників конфіденційності особистої інформації.

Отже, урядам потрібно спільне використання даних, виробники обіцяють його підтримувати, ЗМІ обговорюють плюси і мінуси цього підходу, дослідники в багатьох областях вивчають його. Але що все-таки означає «спільне використання даних»? До числа рекламованих «рішень спільного використання даних» відносяться мережеві маршрутизатори, онтології, федеративні бази даних, пошукові машини і портали. У численних дослідженнях, які зачіпають технічні аспекти спільного використання даних, цей термін вживається в різних сенсах.

Незважаючи на зростаючу важливість для суспільства спільного використання даних, відсутня загальнодоступна концепція, в якій би визначався термін «спільне використання даних», описувалися його основні виміри і проблеми, і пояснювалося, як ставляться до нього типові системи. У попередніх дослідженнях до цієї проблеми підходили з позицій якої-небудь однієї технології, наприклад, Web-сервісів, виділяли в ній деякий аспект, такий як семантична інтеграція або управління захистом авторських прав. Однак корпоративним архітекторам і технологам потрібно загальна концепція, застосовна до широкого спектру реалізаційних технологій.

Олав Лісна, Свен-Арне Рейнемо, Тор Скей, Осхільд Гронстад Солхейм, Томас Содрінг, Ларс Пауль Хьюз, Бьорн Даг Йонсен представили статтю «Мережі межсоединений: архітектурні проблеми центрів обробки даних, що надають комунальні комп'ютерні послуги» (Interconnection Networks: Architectural Challenges for Utility Computing Data Centers).

Кілька років тому увагу ІТ-спільноти привернула концепція grid-середовищ. Ідея, що обчислювальна потужність повинна стати доступною в Internet так само, як електрична енергія доступна в електричних мережах, спонукала дослідників в усьому світі до виконання нових проектів. Хоча, як здається, академічний інтерес до grid ослаб, ця ідея привела до усвідомлення нового режиму використання центрів обробки даних, часто званого режимом надання «комунальних комп'ютерних послуг» (Utility Computing). В цьому режимі система надає ресурси споживачам на вимогу, і зазвичай споживачі платять тільки за ті ресурси, які вони запросили, і за час, протягом якого ці ресурси використовувалися. Для капіталізації цієї моделі постачальники забезпечують різні рішення комунальних послуг, такі як N1 компанії Sun Microsystems, HP Adaptive Enterprise і IBM E-Business On Demand. До числа останніх прикладів систем комунальних комп'ютерних послуг відносяться Sun Grid Compute Utility і Amazon Elastic Compute Cloud.

ЦОД, що надає комунальні комп'ютерні ресурси (Utility Computing Data Center, UCDC), динамічно створює віртуальні сервери, які мають набором доступних ресурсів відповідно до вимог користувачів. Сервіси, підтримувані UCDC, зазвичай володіють різними характеристиками: різні потреби в ресурсах, час роботи, якість програмного забезпечення, вимоги до безпеки і т.д. Крім надання класичних високопродуктивних додатків, сервіс може полягати, наприклад, у створенні і підтримці спеціального сайту футбольного чемпіонату протягом двох місяців.

Хоча існуючі сьогодні рішення комунальних комп'ютерних сервісів в основному складаються в програмному забезпеченні, що виконується над існуючими архітектурними платформами, автори вважають, що для досягнення повної переваги від використання UCDC в майбутньому слід розвивати базову архітектуру.

У дослідженнях мереж межсоединений зазвичай передбачається, що система одночасно може виконувати тільки один клас робіт і що завданням мережі межсоединений є максимізація загальної продуктивності. Різні вимоги до UCDC породжують ряд проблем, які раніше досліджувалися вкрай мало. Автори вважають, що розгорнуті дослідження в області мереж межсоединений дозволять підтримувати таку ж «безшовну» віртуалізацію, як і та, яка забезпечується, наприклад, в процесорах. Таким чином, розвиток технології мереж межсоединений ставить нові проблеми.

Остання велика стаття номера називається «Синтаксичний розбір XML-документів: робочі характеристики» (XML Document Parsing: Operational and Performance Characteristics). Статтю написали Тек Чеун Лем, Джіанксім Джесон Дінг і Джіх-Чарні Ліу.

Широко використовується в додатках баз даних і мережевих додатках мову XML - фактичний стандарт інтероперабельного формату документів. При збільшенні поширеності XML розробникам додатків важливо розуміти робочі характеристики процесу обробки XML.

Як показано на Мал. 2 , При обробці XML виділяються чотири фази: розбір, доступ, модифікація і сериализация. Хоча парсинг є найбільш дорогої операцією, ще не проводилися детальні дослідження, в яких би порівнювалися кроки обробки і відповідні накладні витрати різних моделей розбору, альтернативні способи доступу до розібраним даними і їх модифікації, а також вимоги до доступу і модифікації з боку XML-орієнтованих додатків .

На малюнку також ілюструється триступеневий процес розбору. Перші два кроки - перетворення символів і лексичний аналіз - зазвичай не залежать від моделей розбору, в той час як третій крок - синтаксичний аналіз - створює уявлення даних, засноване на використовуваної моделі розбору.

Щоб допомогти розробникам зробити розумний вибір для своїх цільових програм, автори порівнюють уявлення даних для чотирьох моделей розбору: Document Object Model (DOM; www.w3.org/DOM ), Simple API for XML (SAX; www.saxproject.org ), Streaming API for XML (StAX; http://jcp.org/en/jsr/detail?id=173 ) І Virtual Token Descriptor (VTD; http://vtd-xml.sourceforge.net). Ці представлення даних призводять до різних принцип роботи даного продукту.

У XML-орієнтованих додатків баз даних і мережевих додатків є особливі вимоги по відношенню до доступу до розібраним даними і їх модифікації. У додатків баз даних повинна бути можливість здійснювати доступ до структури документа і модифікувати її в зворотно-поступальному режимі. Розібраний документ розташовується на сервері баз даних, і до нього направляється кілька запитів і операцій модифікації. Мережеві додатки потребують однопрохідному доступі і модифікації. При розпізнаванні кожного вузла аналізованого документа виконуються всі операції доступу і модифікації, необхідні додатком.

Аналіз моделей розбору дозволив прийти до наступних висновків. Моделі DOM і VTD добре підходять для зворотно-поступального режиму обробки XML-документів. Розбір на основі моделі VTD швидше розбору на основі DOM і споживає менше пам'яті. VTD краще підходить для додатків з простими і рідкісними модифікаціями XML. Моделі SAX і StAX придатні для додатків з дуже обмеженою пам'яттю, котрі мають потреби в зворотно-поступальному доступі до XML.

Коротше кажучи, DOM найбільше підходить для додатків баз даних, а SAX і StAX - для потокових додатків. VTD - хороший кандидат на апаратне прискорення через використання симетричною структури даних у вигляді масиву, проте питання ефективності використання комерційних апаратних прискорювачів в додатках реального світу відкритий.

Слід також звернути увагу на замітку «Назустріч Семантичної Глибокої Всесвітній Павутині» (Toward the Semantic Deep Web), яку написали Джеймс Геллер, Сун Ей Чун і Ю Джанг Енн.

Багато організацій генерують «внутрішні дані» (backend data), які можна вибрати тільки динамічно через інтерфейси на основі Web-форм і які, тим самим, не індексуються традиційними пошуковими машинами. Розмір цього прихованого і Неіндексований контенту - його називають Deep Web - в тисячі разів більше розміру контенту «поверхневої» Всесвітньої Павутини.

Для вирішення проблем забезпечення доступу до рясним внутрішнім даними Deep Web, а також конструювання та використання онтологій автори пропонують концепцію Семантичної Глибокої Всесвітньої Павутини (Semantic Deep Web). Semantic Deep Web складається з елементів Deep Web і Semantic Web, зокрема, прихованих внутрішніх джерел даних, інтерфейсу або сервісів Deep Web для доступу до цих джерел даних, а також програм маніпулювання онтологіями.

Deep Semantic Web означає більш складні і орієнтовані на використання методів штучного інтелекту шари так званого «шаруватого пирога» Semantic Web. У той же час, в Semantic Deep Web аспекти Semantic Web комбінуються з використанням браузерів, в яких застосовуються онтології, для добування інформації з Deep Web.

Основними цілями Semantic Deep Web є забезпечення доступу до даних Глибокої Павутини на основі різних Web-технологій і реалізація концепції Семантичної Павутини за рахунок збагачення онтологій з використанням цих даних. До числа дослідницьких напрямків Semantic Deep Web відноситься:

вилучення інформації з Deep Web, зокрема, з сайтів електронної комерції;
семантичне анотування і індексація Deep Web;
забезпечення розуміння схеми Deep Web на основі семантики даних;
організація пошукових машин для Semantic Deep Web;
інтеграція і інтероперабельність даних Semantic Deep Web;
семантичний перегляд і візуалізація даних Deep Web;
напівавтоматична генерація онтологій на основі Deep Web;
якість онтологій;
якість пошуку і релевантність результатів.

У Semantic Deep Web для доступу до Deep Web використовуються два основні підходи, що базуються на технологіях Semantic Web. В обох підходах потрібно краулер Semantic Deep Web.

У першому підході, званому авторами «пошуком з підключенням онтологій» (ontology plug-in search), онтологія предметної області збагачується семантикою даних Deep Web, так що її можна використовувати для підвищення якості результатів запитів, що обробляються традиційними пошуковими машинами типу Google. Другий підхід - «анотування сервісів Deep Web» (Deep Web service annotation) - полягає в тому, що сервіси Deep Web, що підтримують форми для доступу до внутрішніх даних, анотує семантикою даних Deep Web. Отримувані семантично анотовані документи після цього можна шукати з використанням пошукових машин Semantic Web, таких як Swoogle (swoogle.umbc.edu).

Наближається кінець року, і я хочу нагадати, що пора подбати про членство в IEEE Computer Society в 2009 році (подробиці на http://www.computer.org/portal/site/ieeecs/index.jsp ). До наступної зустрічі, Сергій Кузнецов ( [email protected] ).

Мал. 2. Фази обробки XML і кроки розбору. Триступеневий процес розбору є найбільш дорогої операцією обробки XML

Але що все-таки означає «спільне використання даних»?
Org/en/jsr/detail?