Главная

Статьи

Друге життя в віртуальних світах

  1. Друге життя в віртуальних світах

2009 р

Друге життя в віртуальних світах

Сергій Кузнецов

Огляд вересневого 2008 р номера журналу Computer (IEEE Computer Society, V. 41, No 9, September 2008).

Авторська редакція.
Також огляд опублікований в журналі "Відкриті системи"

Оголошеної темою вересневого номера в цьому році є «віртуальні світи» (Virtual Worlds). Однак цій темі присвячені тільки дві великі статті, і відсутні запрошені редактори, а значить, і вступна замітка. Проте, почну огляд з цих двох статей.

Першу статтю написав Карл Симборський ( Carl Symborski , Science Applications International Corporation). Стаття називається «Масштабоване розподіл користувацького контенту для глобальних багатокористувацьких онлайнових світів» ( «Scalable User Content Distribution for Massively Multiplayer Online Worlds»).

Глобальні розраховані на багато користувачів онлайнові ігри (Massively Multiplayer Online Game, MMOG) стають одними з найбільш популярних багатокористувацьких мережевих додатків. Прикладами MMOG є EverQuest компанії Sony і World of Warcraft компанії Blizzard. У цих MMOG забезпечується структурована віртуальне середовище, в якій гравці можуть взаємодіяти з іншими гравцями, переслідуючи спільні цілі або конкуруючи собою, і досягаючи, таким чином, розвитку громадських зв'язків.

Глобальні розраховані на багато користувачів віртуальні світи (Massively Multiplayer Online World, MMOW) представляють собою окремий клас багатокористувацьких мережевих додатків. Прикладами існуючих MMOW-сервісів є There компанії Makena Technologies і Second Life компанії Linden Lab. Відмінністю MMOW від MMOG є те, що сервіс MMOW забезпечує неструктуровану віртуальне середовище, що включає механізми, які дозволяють не тільки розробникам, але і гравцям визначати нові оригінальні об'єкти і поведінка персонажів. Користувачі можуть створювати свій власний контент для прилаштовування необхідного їм віртуального світу.

Однак технічні вимоги, що виникають при підтримці контенту, що створюється користувачами, перевершують вимоги до пропускної здатності сервера, клієнта і мережі, що задовольняють більшість успішних MMOG. Автор аналізує цю проблему шляхом порівняння навантаження на пропускну здатність мережі при використанні MMOG і сервісів MMOW.

Оцінка обсягу мережевого трафіку на стороні клієнта показує, що наявність користувацького контенту в MMOW навантажує мережу в 10 разів більше, ніж існуючі служби MMOG, які не підтримують створення контенту користувачами. Пропускна здатність мережі є критичним фактором, що не дозволяє масштабувати сервіси MMOW на велике число користувачів при збереженні якісної підтримки користувацького контенту.

Пропонується підхід, що дозволяє скоротити рівень вимог до пропускної здатності мережі з боку серверів і клієнтів MMOW при поширенні або оновленні контенту, створеного користувачами. Пропонована архітектура включає три механізму. Перший з них ототожнює призначений для користувача контент ні з індивідуальними сутностями або файлами, а з сукупними колекціями, ідентифікованими зведеними описувачем. Другий механізм - процедура узгодження (reconciliation) даних дозволяє призначеному для користувача клієнту управляти передачею необхідного контенту від серверів MMOW до цього клієнту. У третьому механізмі використовується ієрархія сервісів завантаження, реалізована на основі сервісу CDN (Content Delivery Network). Зведені описатели забезпечують інфраструктуру для відображення користувацького контенту в об'єкти, якими може керувати CDN. Ці поняття є основою філософії завантаження розподіленого користувацького контенту, яка потенційно дозволяє масштабувати сервіси MMOW при зростанні числа гравців.

Додаткових досліджень заслуговують архітектура узгодження даних, продуктивність при різних сценаріях використання MMOW і безпеку на рівні системи і архітектури.

Друга тематична стаття - «Second Life і нове покоління віртуальних світів» ( «Second Life and the New Generation of Virtual Worlds ») - представлена Санджівом Кумаром, Джатін Чхугані, Чангкью Кімом, Дейхьюном Кімом, Ентоні Нгуєном, Прадід Дюбе, Крістіманом комбайнів і Янгміном Кімом ( Sanjeev Kumar , Jatin Chhugani , Changkyu Kim , Daehyun Kim, [email protected], Anthony Nguyen , Pradeep Dubey , Intel, Christian Bienia, Princeton University, Youngmin Kim , University of Maryland).

Віртуальний світ - це імітована з використанням комп'ютерів середовище, в якому користувачі можуть мешкати і взаємодіяти з іншими користувачами або як з ними самими, або через програмних агентів або через графічні уявлення, звані аватарами. У віртуальному світі можуть бути присутніми як двійники об'єктів реального світу, так і об'єкти і явища, які не мають прямих аналогів в реальному світі.

Через обмеженість обчислювальної потужності і мережевих ресурсів сьогоднішніх машин віртуальні світи часто реалізуються з використанням двовимірної графіки зі спрощеними алгоритмами. Це особливо вірно для віртуальних світів, орієнтованих на застосування мобільних пристроїв. Однак в розрахунку на більш потужні комп'ютери розробники віртуальних світів використовують тривимірну графіку і більш складні алгоритми.

Тривимірні віртуальні світи можна грубо класифікувати на онлайнові ігри та метавсесвіт (metaverse). Онлайнові ігри існують вже більше десяти років. Деякі з них, наприклад, «стрілялки» типу Quake розроблялися в розрахунку на невеликі групи спільно грають користувачів (до десяти чоловік). Глобальні розраховані на багато користувачів онлайнові ігри (MMOG) розроблялися з урахуванням можливості масштабування до тисяч одночасних учасників гри.

При наявності користувачів, географічно розподілених в Internet, онлайнові ігри в основному спираються на використання моделі «клієнт-сервер», коли кожен користувач запускає клієнтську програму, що з'єднується з однією або декількома машинами, на яких виконується серверна програма. Сервер відповідає за управління взаємодією кількох персонажів і об'єктів у віртуальному світі, а також комунікаціями з клієнтом. Отже, вимоги до обчислювальної потужності сервера пропорційні розміру віртуального світу і числу клієнтів, одночасно підключених до даного сервера.

Для реалізації сервера, що підтримує MMOG з тисячами одночасних гравців (наприклад, EVE Online ( www.eve-online.com ) Або World of Warcraft (www.worldofwarcraft.com)), потрібно кластер машин. Такий кластер розбивається на Шарден (shard), кожен з яких підтримує конкретний екземпляр даного віртуального світу. На початку кожної своєї ігрової сесії гравець вибирає шард і протягом даної сесії взаємодіє тільки з гравцями в цьому Шардена.

Метавсесвіт є повністю імерсивні (забезпечують реальний ефект присутності) віртуальними просторами, істотно відрізняються від онлайнових ігор в декількох аспектах. Перш за все, метавсесвіт є окремим нерозривний, персистентний світ, в якому користувачі можуть безперешкодно мандрувати без заздалегідь визначених цілей. Для цього потрібні складні комунікаційні протоколи, масштабована ємність сховищ даних і автоматичне балансування навантаження на серверах, що імітують реальний світ. Хоча в деяких MMOG також забезпечується персистентний світ, їх масштаб і складність на порядки поступаються відповідним показникам метавсесвіт.

У онлайнових іграх весь контент генерується фахівцями. Хоча це обмежує можливості користувачів, гарантується якість контенту і його доставка в реальному часі. Однак в метавсесвіт майже весь контент генерується користувачами і знаходиться в їх розпорядженні. Оскільки багато користувачів мало розуміють в тому, як їх рішення впливають на продуктивність, в метавсесвіт необхідно використовувати методи автоматичної оптимізації, яка в MMOG виконується фахівцями, які розробляють контент.

Метавсесвіт значно більші будь-якої окремої онлайнової гри. У них часто є економіка, що розвивається, до якої користувачі купують і продають віртуальні об'єкти, включаючи землю, а також продукти реального світу. У деяких метавсесвіт загальний обсяг щоденних угод може досягати мільйонів реальних доларів.

Контент метавселенной є динамічним, оскільки користувачі безперервно створюють і змінюють об'єкти. На відміну від цього, онлайнові ігри грунтуються на статичних схемах, які представляють весь контент віртуального світу на клієнтській машині. Під час гри сервера MMOG потрібно обмінюватися тільки відносно невеликими порціями даних - в основному, даними, що вводяться користувачами, і даними, що характеризують місце розташування персонажів.

Метавсесвіт стають надзвичайно популярними серед мільйонів активних користувачів по всьому світу. Розширюється набір метавсесвіт, що застосовуються при організації соціальних мереж, в середовищах колективної роботи (workplace collaboration), роздрібної торгівлі, віртуальному туризмі, маркетингу, при навчанні поведінки в надзвичайних ситуаціях і в мистецтві, часто називають 3D-Internet.

Доступ до деяких віртуальні світи надається лише окремим групам користувачів. Наприклад, компанія Forterra Systems створює і підтримує приватні віртуальні світи на основі своєї платформи On-Line Interactive Virtual Environment. Ці метавсесвіт орієнтовані на навчання персоналу або на підтримку колективного прийняття рішень і в них зазвичай відтворюються розташування реального світу.

Однак б про більша частина метавсесвіт відкрита для всіх користувачів і служить засобом підтримки соціальних мереж, комерції, освіти і розваг з деякими елементами фентезі. Перша метавсесвіт, CitySpace, була представлена на конференції SIGGRAPH 1993 р і підтримувалася до 1996 р ( http://en.wikipedia.org/wiki/Cityspace ). З тих пір з'явилося безліч метавсесвіт, до числа яких відносяться Active Worlds ( www.activeworlds.com ) І There ( www.there.com ).

В даний час найбільш популярною метавселенной є Second Life компанії Linden Lab , В якій у віртуальній формі присутні багато корпорацій, університети, міста, посольства, творчі працівники та прості люди. На малюнку показані скріншоти трьох регіонів Second Life: футуристичний місто Miramare, шведське посольство, створене Шведським інститутом (Swedish Institute) і острів, створений міжнародної PR-компанією Edelman.

Сцени з Second Life, зліва направо:   Miramare;  шведське посольство;  острів Edelman
Сцени з Second Life, зліва направо:
Miramare; шведське посольство; острів Edelman

Обчислювальні та комунікаційні вимоги метавсесвіт значно перевершують вимоги онлайнових ігор. Наприклад, один сервер може обслуговувати кілька тисяч клієнтів MMOG, але лише близько сорока клієнтів Second Life. Для кращого розуміння цього нового виду додатків автори зробили детальний аналіз архітектури Second Life, а також технічних вимог цієї метавселенной до клієнтів, серверів і мережі.

На відміну від традиційних онлайнових ігор, метавсесвіт, подібні Second Life, повинні генерувати динамічний контент, який в основному створюється користувачами і постійно модифікується. Аналіз авторів показує, що це викликає значні вимоги до клієнтів, серверів і мережі. У міру того, як віртуальні світи будуть підтримувати б про льше число користувачів і типів взаємодій, а також забезпечувати б о більшу реалістичність, рівень цих вимог буде зростати на порядки величин. Тому метавсесвіт гратимуть важливу роль в розробці майбутніх комп'ютерних систем.

Авторами статті «Діляться все: проблема систем зі спільним використанням даних» ( «Everybody Share: The Challenge of Data-Sharing Systems») є Кен Сміт, Льон Селігман і Віпін Сварап ( Ken Smith , Len Seligman , Vipin Swarup , The Mitre Corporation).

Фізичні особи, комерційні підприємства та урядові установи спільно використовують гігантські обсяги даних з використанням найрізноманітніших технологій: Web-сервісів, сховищ даних, порталів, каналів RSS і пірінгових (peer-to-peer, P2P) систем поділу файлів. Спільне використання даних в науці привело до появи нової поддісціплін - науки, керованої даними (data-driven science), в якій дослідники використовують великі масиви даних, такі як геномні бази даних і цифрові обсерваторії (digital sky survey) для генерації і перевірки нових гіпотез. Середовища спільного використання даних значно розширюються. Наприклад, через три роки після утворення пиринговой мережі Gnutella в ній присутнє 100000 вузлів з 20000000 файлів.

На тлі успішного спільного використання даних підвищується рівень вимог. На думку антитерористичної комісії уряду США (комісія 9/11), недосконале спільне використання даних є ключовою перешкодою при запобіганні терористичних атак. Основною проблемою діяльності по боротьбі зі спалахами пандемій є забезпечення можливості спільного використання даних «біоконтролю» (biosurveillance) урядовим установам, госпіталів та інших організаціям.

У той же час спільне використання даних є джерелом значних конфліктів. Користувачі пірінгових систем поділу файлів продовжують конфліктувати з індустрією розваг, а зусилля уряду щодо спільного використання інформації про тероризм викликають протести з боку захисників конфіденційності особистої інформації.

Отже, урядам потрібно спільне використання даних, виробники обіцяють його підтримувати, засоби масової інформації обговорюють плюси і мінуси цього підходу, дослідники в багатьох областях вивчають його. Але що все-таки означає «спільне використання даних»? До числа рекламованих «рішень спільного використання даних» відносяться мережеві маршрутизатори, онтології, федеративні бази даних, пошукові машини і програмне забезпечення порталів. У численних дослідженнях, які зачіпають технічні аспекти спільного використання даних, цей термін використовується в різних сенсах.

Незважаючи на зростаючу важливість для суспільства спільного використання даних, відсутня загальнодоступна концепція, в якій би визначався термін «спільне використання даних», визначалися його основні виміри і проблеми, і пояснювалося, як ставляться до нього типові системи. У попередніх досліджень до цієї проблеми з позицій якої-небудь однієї технології, наприклад, Web-сервісів, або виділяли в ній деякий аспект, такий як семантична інтеграція або управління захистом авторських прав. Однак корпоративним архітекторам і технологам потрібно загальна концепція, застосовна до широкого спектру реалізаційних технологій. У статті представлена ​​така концепція, і її основні риси проілюстровані прикладами з різних областей застосування спільного використання даних.

Олав Лісна, Свен-Арне Рейнемо, Тор Скей, Осхільд Гронстад Солхейм, Томас Содрінг, Ларс Пауль Хьюз, Бьорн Даг Йонсен ( Olav Lysne , Sven-Arne Reinemo , Tor Skeie , Åshild Grønstad Solheim , Thomas Sødring , University of Oslo, Lars Paul Huse , Bjørn Dag Johnsen , Sun Microsystems, Oslo) представили статтю «Мережі межсоединений: архітектурні проблеми центрів даних, що надають комунальні обчислювальні послуги» ( «Interconnection Networks: Architectural Challenges for Utility Computing Data Centers»).

Кілька років тому значна увага спільноти привернула концепція обчислювального гріда. Та ідея, що обчислювальна потужність повинна стати доступною в мережі Internet так само, як електрична енергія доступна в електричних мережах, спонукала дослідників в усьому світі до виконання нових проектів, які зачіпають різні проблеми.

Хоча, як здається, академічний інтерес до обчислювальні грід ослаб, ця ідея привела до усвідомлення нового режиму використання обчислювальних центрів даних, часто званого режимом надання комунальних обчислювальних послуг (utility computing). В цьому режимі система надає ресурси споживачам на вимогу, в якому напрошується поднабор ресурсів центру даних на певний час. Зазвичай споживачі платять тільки за ті ресурси, які вони вимагали, і за той час, протягом якого ці ресурси використовувалися. Для капіталізації цієї моделі постачальники забезпечують різні рішення комунальних обчислювальних послуг, такі як N1 компанії Sun Microsystems, Adaptive Enterprise компанії Hewlett-Packard і E-Business On Demand компанії IBM. До числа останніх прикладів систем комунальних обчислювальних послуг відносяться Grid Compute Utility компанії Sun Microsystems і Elastic Compute Cloud компанії Amazon.

Центр даних, що надає комунальні обчислювальні ресурси (utility computing data center, UCDC) динамічно створює віртуальні сервери, які мають набором доступних ресурсів відповідно до вимог користувачів. Сервіси, підтримувані UCDC, зазвичай володіють різними характеристиками: різні потреби в ресурсах, час роботи, якість програмного забезпечення, вимоги до безпеки і т.д. Крім класичних високопродуктивних додатків, сервіс може полягати, наприклад, у створенні і підтримці спеціального Web-сайту футбольного чемпіонату протягом двох місяців.

Хоча існуючі сегодня решение комунальних обчислювальних сервісів в основному складаються в програмному забезпеченні, что віконується над існуючімі архітектурнімі платформами, авторизованого вважають, что для Досягнення повної Преимущества від использование UCDC в Майбутнього слід розвіваті базову архітектуру. У число інновацій входять розробка апаратної підтримки віртуалізації в процесорах різних виробників.

У дослідженнях мереж межсоединений зазвичай передбачається, що система одночасно може виконувати тільки один клас робіт, і що завданням мережі межсоединений є максимізація загальної продуктивності. Різні вимоги до UCDC породжують ряд проблем, які раніше досліджувалися вкрай незначно. Автори вважають, що розгорнуті дослідження в області мереж межсоединений дозволять підтримувати таку ж «безшовну» віртуалізацію, як та, яка забезпечується, наприклад, в процесорах. Таким чином, розвиток технології мереж межсоединений ставить нові проблеми, а й забезпечує нові можливості розвитку UCDC.

Остання велика стаття вересневого номера називається «Парсинг XML-документів: робочі характеристики» ( «XML Document Parsing: Operational and Performance Characteristics»). Статтю написали Тек Чеунг (Брайан) Лем, Джіанксім Джесон Дінг і Джіх-Чарні Ліу ( Tak Cheung (Brian) Lam , Jianxun Jason Ding , Cisco Systems, Jyh-Charn Liu , Texas A & M University).

Широко використовується в додатках баз даних і мережевих додатках розширювана мова розмітки XML є фактичним стандартом інтероперабельного формату документів. При збільшенні поширеності XML розробникам додатків важливо розуміти робочі характеристики процесу обробки XML.

Малюнок: фази обробки XML і кроки парсинга. Триступеневий процес парсинга є найбільш дорогої операцією обробки XML

Як показує малюнок, при обробці XML є чотири фази: парсинг, доступ, модифікація і сериализация. Хоча парсинг є найбільш дорогої операцією, не проводилися детальні дослідження, в яких би порівнювалися кроки обробки і відповідні накладні витрати різних моделей парсинга, альтернативні способи доступу до розібраним даними і їх модифікації, а також вимоги до доступу і модифікації з боку XML-орієнтованих додатків.

На малюнку також ілюструється триступеневий процес парсинга. Перші два кроки - перетворення символів і лексичний аналіз зазвичай не залежать від моделей парсинга, в той час як третій крок - синтаксичний аналіз створює уявлення даних, засноване на використовуваної моделі парсинга.

Щоб допомогти розробникам зробити розумний вибір моделі парсинга для своїх цільових програм, автори порівнюють уявлення даних для чотирьох представницьких моделей парсинга: document object model (DOM; www.w3.org/DOM ), Simple API for XML (SAX; www.saxproject.org ), Streaming API for XML (StAX; http://jcp.org/en/jsr/detail?id=173 ) І virtual token descriptor (VTD; http://vtd-xml.sourceforge.net ). Ці представлення даних призводять до різних принцип роботи даного продукту.

У XML-орієнтованих додатків баз даних і мережевих додатків є особливі вимоги по відношенню до доступу до розібраним даними і їх модифікації. У додатків баз даних повинна бути існувати можливість здійснювати доступ до структури документа і модифікувати її в зворотно-поступальному режимі. Розібраний документ розташовується на сервері баз даних, і до нього направляється кілька запитів і операцій модифікації. Мережеві додатки потребують однопрохідному доступі і модифікації. При розпізнаванні кожного вузла аналізованого документа виконуються всі операції доступу і модифікації, необхідні додатком.

Аналіз моделей парсинга дозволив авторам прийти до наступних висновків. Моделі DOM і VTD добре підходять для зворотно-поступального режиму обробки XML-документів. Парсинг на основі моделі VTD працює швидше парсинга на основі DOM і споживає менше пам'яті. VTD краще підходить для додатків з простими і рідкісними модифікаціями XML. Моделі SAX і StAX придатні для додатків з дуже обмеженою пам'яттю, котрі мають потреби в зворотно-поступальному доступі до XML.

Коротше кажучи, DOM найбільше підходить для додатків баз даних, а SAX і StAX - для потокових додатків. VTD є хорошим кандидатом на апаратне прискорення через використання симетричною структури даних у вигляді масиву, але відкритим питанням є ефективність використання комерційних апаратних прискорювачів в додатках реального світу.

На мій погляд, слід також звернути увагу на замітку, опубліковану в колонці «IT Systems Perpectives». Ця замітка називається «Назустріч Семантичної Глибокої Всесвітній Павутині» ( «Toward the Semantic Deep Web») і написана Джеймсом Геллер, Суном Ейем Чуном і Ю Джангом Енном ( James Geller , New Jersey Institute of Technology, Soon Ae Chun , City University of New York, Yoo Jung An , Fairleigh Dickinson University).

Багато організацій генерують внутрішні дані (backend data), які можна вибрати тільки динамічно через інтерфейси на основі Web-форм, і які, тим самим, не індексуються традиційними пошуковими машинами. Цей прихований, невидимий і не індексований контент називається Глибокої Павутиною (Deep Web), і його розмір в тисячі разів більше розміру контенту «поверхневої» Всесвітньої Павутини.

Для вирішення проблем забезпечення доступу до рясним внутрішнім даними Deep Web, а також конструювання та використання онтологій автори пропонують концепцію Семантичної Глибокої Всесвітньої Павутини (Semantic Deep Web). Semantic Deep Web складається з елементів Deep Web і Semantic Web, зокрема, прихованих внутрішніх джерел даних, інтерфейсу або сервісів Deep Web для доступу до цих джерел даних, а також програм маніпулювання онтологіями.

Важливо не плутати Semantic Deep Web з Глибокої Семантичної Павутиною (Deep Semantic Web), яка є частиною вихідної концепції Semantic Web. Deep Semantic Web означає більш складні і орієнтовані на використання методів штучного інтелекту шари так званого «шаруватого пирога» Semantic Web. У той же час, в Semantic Deep Web аспекти Semantic Web комбінуються з використанням браузерів, в яких застосовуються онтології, для добування інформації з Deep Web.

Основними цілями Semantic Deep Web є забезпечення доступу до даних Глибокої Павутини на основі різних Web-технологій і реалізація концепції Семантичної Павутини за рахунок збагачення отнологій з використанням цих даних. До числа дослідницьких напрямків Semantic Deep Web відноситься наступне:

  • вилучення інформації з Deep Web, зокрема, з сайтів електронної комерції;
  • семантичне анотування і індексація Deep Web;
  • забезпечення розуміння схеми Deep Web на основі семантики даних;
  • організація пошукових машин для Semantic Deep Web;
  • інтеграція і інтероперабельність даних Semantic Deep Web;
  • семантичний перегляд і візуалізація даних Deep Web;
  • напівавтоматична генерація онтологій на основі Deep Web;
  • якість онтологій;
  • якість пошуку і релевантність результатів.

У Semantic Deep Web для доступу до Deep Web використовуються два основні підходи, заснованих на технологіях Semantic Web. В обох підходах потрібно краулер Semantic Deep Web.

У першому підході, званому авторами пошуком з підключенням онтологій (ontology plug-in search), онтологія предметної області збагачується семантикою даних Deep Web, так що її можна використовувати для підвищення якості результатів запитів, що обробляються традиційними пошуковими машинами типу Google. Другий підхід - анотування сервісів Deep Web (Deep Web service annotation) - полягає в тому, що сервіси Deep Web (сайти, що підтримують форми для доступу до внутрішніх даних) анотує семантикою даних Deep Web. Отримувані семантично анотовані документи після цього можна шукати з використанням пошукових машин Semantic Web, таких як Swoogle .

Першим кроком на шляху створення дослідницького співтовариства Semantic Deep Web з'явився перший міжнародний семінар «The Semantic Web Meets the Deep Web» , Що пройшов у Вашингтоні в липні 2008 р

Але що все-таки означає «спільне використання даних»?
Org/en/jsr/detail?

Новости