Размер шрифта

A
A

Межстрочный интервал

A
A

Цвет

A
A
16.02.2023

Спросить у «Алисы» — всё равно что вскипятить чайник: почему управление информацией — это энергозатратно

16.02.2023

В третий четверг февраля отмечается Всемирный день управления информацией, напоминающий нам, мы живем в информационном обществе. Аспирант Южного федерального университета рассказал, в какой потолок может упереться человечество, обрабатывая всё новые и новые данные «в облаке».

Владеющий информацией — владеет миром, особенно в 21 веке. Способствовали этому в первую очередь новые технологии передачи и хранения информации, которые постоянно увеличивают скорость и объём передаваемой информации и меняют её характер. Однако, владеть информацией, как и миром, — удовольствие не из дешевых: сервера и дата-центры, на которых записано всё, что есть в Интернете, потребляют колоссальное количество энергии. Треть мирового электричества, с таким трудом вырабатываемого всеми электростанциями ценой сжигания миллионов тонн топлива, уходит именно на управление информацией.

На какие онлайн-операции уходит больше всего электричества и сколько стоит в киловаттах каждый наш интернет-клик, рассказал инженер-исследователь Международного исследовательского института интеллектуальных материалов ЮФУ, аспирант направления «Искусственный интеллект и машинное обучение» Дмитрий Поляниченко.

«Чем больше вычислений – тем больше нужно энергии. Каждый современный пользователь знает, что смартфон будет терять заряд быстрее, если запустить на нем фильм. Это нормально, количество вычислений возрастает, значит возрастает и энергопотребление. Если говорить об обычном пользователе ПК или смартфона, то естественно, самыми затратными будут современные игры. Они используют ресурсы устройства на максимум и требуют огромного количества вычислений. Пока вы просто играете, компьютер или смартфон, десятки раз в секунду обновляет информацию на экране, совершает множество вычислений для каждого объекта виртуального мира — траектория полета мяча, объем коробки, скорость и направление потока воды, сохраняет и загружает большие объемы данных и многое другое», — поделился Дмитрий Поляниченко.

Он добавил, что это касается только современных крупных проектов: если взять игру из «нулевых», то она, скорее всего, потребует меньше ресурсов, чем браузер с открытой лентой ВК. Еще из достаточно энергозатратных процедур инженер-исследователь ЮФУ выделил видеосъемку и использование сервисов просмотра коротких видео типа «VK клипы», а также ряд специализированных задач: например, рендеринг или обучение нейронной сети.

«Правила количества вычислений также работают и на сервере. И если говорить об обмене данными, то скачать фильм, поиграть в онлайн-игру или послушать музыку – это практически одинаковые по нагрузке операции. С точки зрения вычислительной техники все это данные и энергозатраты здесь будут считаться, исходя из простого количества. Например, при условии идеальной среды без внешних факторов, вы прослушали 2 часа музыки общим объемом 2 Гб, а затем скачали фильм длительностью в 3 часа и объемом в 1 Гб. Сервер при этом потратил больше энергии на передачу вам файлов музыки», — объяснил Дмитрий Поляниченко.

Но что же происходит с информацией, которую мы сохранили «в облаке» и не запрашиваем прямо сейчас? Теоретически, она записана на жесткий диск и если сервер правильно выключить и включить, то с данными ничего не случится, а значит и энергия на хранение не нужна. Но на практике, электроэнергия естественно тратится, так как, во-первых, сервер работает независимо от того, пользуетесь вы им или нет, а во-вторых, современные методы хранения данных намного сложнее стандартного пользовательского файлового хранилища, и если сервер на какое-то время останется без питания, то вполне возможна ситуация, когда информация сохранится, но прочитать ее будет невозможно.

«Ваш пост на стене ВК, который вы выложили десять лет назад, загружается каждый раз, когда кто-нибудь открывает вашу страницу. Пользователь может и не долистать до него, но сервер уже закэширует (подготовит) информацию, чтобы по необходимости отправить его на компьютер. А энергия будет расходоваться пока жесткий диск с этой информацией подключен к сети и на нем выполняются операции», — подчеркнул Дмитрий Поляниченко.

При этом старую информацию с серверов не удаляют, по крайней мере не с целью энергосбережения. Все-таки уровень потребляемой энергии зависит больше всего от загруженности вычислительными операциями, а не от количества информации. При этом существует необходимость в рациональном использовании памяти — в этом случае используется очистка данных, но не старых, а неактуальных. Например, обновился дизайн сайта компании или вышла новая версия приложения, тогда старые материалы удалятся с основного сервера. Также частая практика – удаление длительное время неактивных аккаунтов в социальных сетях, сервисах и так далее.

Так на какие же процессы тратится энергия, когда мы делаем запрос в интернете, Дмитрий Поляниченко ответил на примере работы Яндекс.Станции с голосовым помощником «Алиса».

«Алиса, как и большинство известных ассистентов работает по стандартному сценарию. Она записывает голос пользователя от ключевой фразы до глубокой паузы. Получается аудиофайл, как на диктофоне. После этот файл отправляется через интернет на сервер с главным вычислительным центром, своеобразным «центральным разумом» всех Алис. Далее аудио расшифровывается и преобразуется в текст – это стандартная процедура распознавания речи. Далее текст анализируется.  На этом этапе необходимо определить его тип — запрос, команда или диалог, понять содержание. После этого выполняется набор действий, который необходим в качестве ответа на запрос, например поиск информации в интернете, выключение лампочки умного дома или получение прогноза погоды. На основе выполненных действий формируется текст ответа пользователю, затем он преобразуется в аудиофайл и отправляется обратно в смартфон или станцию. А там уже просто воспроизводится стандартными средствами. Очевидно, что такой перечень операций требует огромного количества вычислений на сервере, где и происходит вся обработка запроса от пользователя. А самый энергозатратный процесс в электронике – вычислительный. Так что можно сказать, что по энергозатратности спросить что-то у «Алисы» — всё равно что вскипятить чайник», — рассказал Дмитрий Поляниченко.

Но в то же время, добавляет Дмитрий, это не значит, что если в минуту на сервер приходит тысяча запросов к Алисе, то он тратит энергии столько же, сколько нужно для кипячения тысячи чайников. Для современных цифровых систем такая трата ресурсов – непозволительная роскошь. Сейчас есть множество приемов и подходов, для обработки данных как можно экономнее, от параллельных вычислений до ассоциирования данных.

Краткая ссылка на новость sfedu.ru/news/71138

Дополнительные материалы по теме