Глоссарий терминов
"Бизнес для бизнеса" "Бизнес для потребителя" Account Active content Advanced search Alt Article ASCII Back-office Cookie CTR DNS IP-адрес IP-адрес хоста IP-интерфейс IP-сеть JavaScript PageRank Pay-per-Click, PPC Procurement Systems Robots.txt SEO SERP Supply Chain Management TCP TF*IDF Type-in трафик URL Usability WHOIS Автоматизация сайта Авторизация Административная система Адрес страницы Аплет Аплоад Архитектура сайта асессор, эксперт Атрибут тега Аудитория веб-сайта Аутентификация Баги База данных Бан Баннер Баннерная сеть Бизнес-решение Брандмауэр Браузер Брэнд Брэндинг булевская или двоичная модель Веб Веб-дизайн Веб-документ Веб-кольцо Веб-сайт Веб-сервер Веб-страница Веб-узел коммерческий векторная модель Вендор Верификация вероятностная модель Вес ключевого слова Видеоконференция Виртуальная реальность Виртуальное предприятие Виртуальный офис ВИЦ. Взвешенный индекс цитирования Владелец информации внетекстовые (внестраничные) критерии Входная страница входные страницы Гамма-коррекция Генеральная общедоступная лицензия Гиперсреда Гиперссылка Гипертекст Главная страница Гостевая книга графематический анализ, лексический анализ, токенизация Данлоад Данные Дизайн дизамбигуация, таггинг Динамический дизайн Динамический контент Директ хит Домашняя страница домен Домен Доменное имя дубликаты Заголовки иллюзия свежести имя хоста инвертированный файл Индекс индекс цитирования Индекс цитирования Индексирование индексирование, индекс, индексация Интернет каталог информационный поиск ИЦ Карта сайта Карта ссылок Каталог Клик Клоакинг Ключевое слово Ключевые слова Конверсия Конкуренция по ключевым словам Контекстная реклама Контент лемматизация, нормализация маршрутизатор Мета-теги Модератор Непотистский спам Обмен ссылками Обмен статьями обратная встречаемость или частота в документах обратная связь, псевдо-обратная связь Описание страницы Оптимизация архитектуры сайта основа Плата за клик Плотность ключевого слова подпись, сигнатура Позиционирование в поисковой системе поиск по смыслу поиск похожих документов Поисковая машина поисковая система, информационно-поисковая система, ИПС, поисковая машина, машина поиска, «поисковик» поисковый запрос, предписание Поисковый робот Поисковый спам Показ полисемия полнота, охват Положение ключевого слова на странице Популярные запросы посетителей порт Посещаемость Постоянная аудитория приблизительные дубликаты Продвижение Промоутер прюнинг Прямая ссылка прямой поиск Раздел сайта различительная сила слова или контрастность термина Ранг Ранжирование Раскрутка регулярное выражение, шаблон, маска Редирект Результаты поиска релевантность Релевантность Ресурс Рунет Сайт Семантический анализ Семантическое ядро Скрытый текст словоизменение словообразование Словоформа сокет спам поисковых систем Спам, спамминг Спамдексинг Ссылающийся сайт Ссылочная популярность статическая популярность (PageRank) стемминг стоп-слова Стоп-слова суффиксные деревья, суффиксные массивы тВИЦ, Тематический ВИЦ Титул, содержимое тега title Точка входа Точка выхода точность Тэг комментария узел Уникальный посетитель Флэш Фрейм хеш-значение Хит Холл Целевая аудитория Целевой переход Целевые посетители частота (слова) в документах, встречаемость в документах, документная частота Частота ключевого слова частота термина шингл шлюз Ядро аудитории
"Бизнес для бизнеса" (business-to-business), B2B - Сектор рынка, ориентированный на организацию работы с контрагентами и партнерами в процессе производства и продажи товаров или услуги. В данный сектор входят все торговые отношения между различными фирмами, организация поставок, продаж, согласование контрактов и планов.
"Бизнес для потребителя" (business-to-customer), B2C - Сектор рынка, ориентированный на работу с потребителями товаров или услуги. В сектор В2С входят электронные магазины, организации, торгующие продукцией через Интернет непосредственно для потребителей.
Account - Вход в систему или имя пользователя в системе, понимаемые как совокупность прав пользователя по отношению к многопользовательской системе, образующихся после его регистрации в виде своеобразной "учетной записи" на компьютере провайдера и подразумевающих наличие собственного имени для входа, пароля, домашнего каталога.
Active content - Музыка, кинофильмы и интерактивные документы на WWW-сервере.
Advanced search - Усложненный (расширенный) запрос из нескольких слов.
Alt (alt tag) – Тэг альтернативного текста, который показывает браузер, когда пользователь не хочет или не может видеть изображение на веб-странице. Использование в коде страницы alt-тэгов, содержащих ключевые слова (keywords), может повысить рейтинг страницы в листе ответов поисковой системы.
Article - Отдельная публикация, содержащаяся в каком-либо ином информационном ресурсе Internet.
ASCII - Универсальный машинный код для букв английского алфавита и знаков.
Back-office - Интеграция информационно-учетной системы компании с интернет, информация об онлайновых заказах на закупку/продажу автоматически поступает для обработки во внутреннюю систему.
Cookie - Небольшой файл, создаваемый браузером пользователя (по указанию программного обеспечения на веб-сервере), содержащий некоторые данные. Используется для определения уникальности пользователя, времени его последнего визита, личных настроек, сделанных пользователем.
CTR (Click-Through-Ratio) - Отношение числа кликов по рекламному материалу или ссылке к числу их показов посетителям. Выражается в процентах.
Система доменных имён (DNS) - дерево доменных имён. Каждый узел дерева содержит записи с различной информацией о домене.
Дерево делится доменные на зоны. Зоной называется коллекция узлов, которые обслуживаются авторизованным DNS-сервером. Один DNS-сервер может обслуживать несколько доменных зон.
IP-адрес - идентификатор компьютера или устройства в сетях TCP/IP и является уникальным 32-битным идентификатором IP-интерфейса в Интернет. IP-адрес записывается как последовательность чисел, разделённых точками. Например, 100.128.0.15 - корректный IP-адрес. Под одним IP-адресом (адресом шлюза) могут работать несколько компьютеров. IP адреса бывают постоянными или динамическими (могут меняться при каждом новом соединении с Интернетом).
IP-адрес хоста (адреса IP-интерфейса узла сети) состоит из номера IP-сети, который занимает старшую область адреса, и номера хоста в этой сети, который занимает младшую часть.
IP-интерфейс - интерфейс компьютера, который может принимать и отправлять блок данных, определяемый протоколом IP для передачи по IP-сети между IP-интерфейсами.
IP-сеть - множество компьютеров (IP-интерфейсов), часто, но не всегда подсоединенных к одному физическому каналу передачи данных, способных пересылать данные друг другу непосредственно (то есть без ретрансляции через промежуточные компьютеры), имеющие IP-адреса с одинаковой сетевой частью.
JavaScript - Язык программирования, обычно используемый в веб-страницах для создания подпрограмм (скриптов). Скрипты поисковые системы не индексируют.
PageRank - Алгоритм расчёта авторитетности страницы, а также сам показатель авторитетности в численном выражении, параметр, показывающий уровень ссылочного ранжирования, или попросту важности сайта.
Pay-per-Click, PPC - Способ оплаты рекламы не за число показов, а за число кликов, то есть полученных посетителей.
Procurement Systems - Системы связи потребителей продукции с производителями, покупателей с продавцами. В этих системах покупателями и продавцами выступают юридические лица и, как правило, существуют в той или иной мере развитые бэк-офисные системы.
Robots.txt - Текстовый файл в корневом каталоге сайта, указывающий роботам поисковых систем, для каких страницы сайта требуется индексация. Стандартные роботы следуют инструкциям, содержащимся в этом файле.
SEO (Search engines optimization) - Поисковая оптимизация сайта с целью получения высоких мест в результатах поиска по заданным запросам.
SERP (Search engine result page) - Результаты поиска. Так же называется страница результатов поиска, выдаваемая поисковой системой по запросу пользователя.
Supply Chain Management - Обеспечивает бесперебойное поступление информации о поставках и логистику всех контрагентов для основного производства.
Протокол TCP (Transmission Control Protocol, Протокол контроля передачи) обеспечивает сквозную доставку данных между прикладными процессами, запущенными на узлах, взаимодействующих по сети.
TF*IDF – численная мера соответствия слова и документа в векторной модели; тем больше, чем относительно чаще слово встретилось в документе и относительно реже в коллекции.
Type-in трафик - Способ попадания пользователя на сайт, когда он вручную вводит адрес сайта в поле URL браузера.
URL (Uniform Resource Locator) - Уникальный интернет-адрес веб-страницы или какого-то другого интернет-ресурса.
Usability - Удобство использования сайта.
WHOIS - протокол, основанный на TCP, используется для запросов к базам данных WHOIS. С его помощью можно проверить занятость доменного имени или IP-адреса и получить общедоступные сведения о его владельце.
Сервис WHOIS был создан как служба, позволяющая системным администраторам узнавать контактную информацию о владельцах доменов или IP-адресов.
Автоматизация сайта – Комплекс мер по созданию программных решений, позволяющих владельцу сайта самостоятельно управлять содержимым и параметрами работы этого сайта.
Авторизация (authorization) - Предоставление полномочий (прав) на выполнение определенных действий в системе обработки данных на удаленном сервере. Авторизацией так же называется процедура проверки на подлинность пароля или сочетания логического идентификационного имени и пароля, введенных пользователем в интерактивную форму.
Административная система (management system) - Система, обеспечивающая управление веб-узлом или его частью. Осуществляет защиту контента и контроль доступа.
Адрес страницы (URL – Uniform Resource Locator) – Данные, точно определяющие логический адрес сайта или страницы в Интернете.
Аплет - Независимое приложение, написанное на языке Java и предназначенное для включения его в html-документ в качестве элемента web-страницы.
Аплоад (upload) - процесс загрузки файлов на удаленный компьютер как правило через FTP.
Архитектура сайта - Систематизация информации и навигации по ней с целью помочь посетителям более успешно находить нужные им данные. Хорошо продуманная грамотная архитектура сайта гарантирует, что пользователи потратят меньше времени на поиск нужной информации.
асессор, эксперт (assesor) – специалист, выносящий заключение о релевантности документа, найденного поисковой системой.
Атрибут тега – Параметр html-страицы, соответствующий каждому конкретному тегу.
Аудитория веб-сайта (audience) - Общее обозначение посетителей веб-узла. Объем аудитории является характеристикой успеха Интернет-проекта.
Аутентификация - Процесс идентификации участвующей стороны.
Баги (bugs) – Разнообразные ошибки или дефекты.
База данных (database) - Совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования, независимая от прикладных программ. База данных является информационной моделью предметной области. Обращение к базам данных осуществляется через системы управления базами данных (СУБД).
Бан (ban) – Блокирование доступа для пользователя к содержимому сайта.
Баннер (banner) - изображение или текстовый блок рекламного характера, являющийся гиперссылкой на страницы с расширенным описанием продукта или услуги. Баннеры делятся на графические и текстовые.
Баннерная сеть - Объединение сайтов, на страницах которых на определенных условиях размещаются баннеры участников, а также баннеры компаний, оплативших размещение своего баннера.
Бизнес-решение (business solutions) - Система, обеспечивающая функционирование бизнеса, вся деятельность которого основана на интернет-технологиях (порталы, каталоги, интернет-СМИ, электронные магазины, электронные аукционы и так далее).
Брандмауэр (firewall) - Барьер, запрещающий доступ к защищаемой сети всех протоколов, кроме разрешенных.
Браузер (browser) - Программа, установленная на компьютере пользователя и позволяющая просматривать документы в форматах html, xml и др., расположенные на удалённых веб-серверах.
Брэнд (brand) - Защищенный законодательно продукт, компания (её название) или концепция, выделенные общественным сознанием массы себе подобных. Набор идентификаторов, позволяющих потребителю отличить товар конкретного производителя. Брэнд включает в себя отношение потребителей к торговой марке, то, что принято называть "брэнд имидж".
Брэндинг - Область системы маркетинговых коммуникаций, занимающаяся разработкой фирменного стиля, его элементов, формированием уникального имиджа фирмы, отличающего ее от конкурентов.
булевская или двоичная модель (boolean model) – модель поиска, опирающаяся на операции пересечения, объединения и вычитания множеств.
Веб (WWW, World wide web, Web) - Сервис сети Интернет, позволяющий получать доступ к массивам информации, размещеннным в глобальной сети. Удобство пользования Веб обеспечивает гиперсреда, наглядность - интерактивные мультимедийные средства.
Веб-дизайн - Вид художественно-проектной деятельности, направленный на создание и обеспечение удобства использования веб-ресурсов.
Веб-документ - Текстовый файл с расширением .html или .htm .
Веб-кольцо - Сайты сходной тематики, объединенные взаимными ссылками. Эффективный инструмент для поиска информации и продвижения контент-ресурсов.
Веб-сайт (web site) - Совокупность веб-страниц, объединенных по смыслу, в также имеющих общую структуру и навигацию.
Веб-сервер (сервер WWW) - Сервер, предназначенный для представления взаимосвязанной мультимедийной информации и содержимого баз данных в Интернет.
Веб-страница (WWW page) - Документ, имеющий уникальный адрес, который можно открыть и посмотреть с помощью броузера. Страницы составляют WWW. Как правило, это мультимедийные документы, включающие текст, графику, звук, видео или анимацию, а также гиперссылки на другие документы.
Веб-узел коммерческий - Виртуальное представительство коммерческой компании в сети Интернет.
векторная модель– модель информационного поиска, рассматривающая документы и запросы как векторы в пространстве слов, а релевантность как расстояние между ними.

Вендор (vendor) - Оптовая фирма, предлагающая к продаже товар.
Верификация (verification) - Установление соответствия принятой и переданной информации с помощью логических методов. Также проверка информации на истинность.
вероятностная модель – модель информационного поиска, рассматривающая релевантность как вероятность соответствия данного документа запросу на основании вероятностей соответствия слов данного документа идеальному ответу.
Вес ключевого слова (keyword weight) – Отношение частоты использования ключевого слова к общему количеству слов на индексируемой странице, выраженное в процентах. В общем случае, увеличение веса ключевого слова на странице ведет к повышению ее релевантности.
Видеоконференция (video conferencing) - Методология проведения совещаний и дискуссий между группами удаленных пользователей с исполнением трансляции изображения в среде Интернет.
Виртуальная реальность (virtual reality) - Технология информационного взаимодействия, реализующая с помощью комплексных мультимедиа-операционных сред иллюзию непосредственного вхождения и присутствия в реальном времени в стереоскопически представленном "экранном мире".
Виртуальное предприятие (virtual corporation) - Сообщество географически разделенных работников, которые взаимодействуют в процессе труда, используя в основном или исключительно электронные средства коммуникаций.
Виртуальный офис (virtual office) - Интернет-ресурс, или его часть, позволяющие географически разобщенным сотрудникам компании, взаимодействовать посредством единой системы для обмена, хранения, обработки и передачи информации и управляющих воздействий.
ВИЦ. Взвешенный индекс цитирования (ИЦ) Яндекса - Учитывает число страниц, ссылающихся на сайт, и собственный ВИЦ этих страниц. Рассчитывается для каждой страницы в базе Яндекса. Обновляется два раза в неделю. Является одним из факторов, влияющих на положение страницы в результатах поиска Яндекса.
Владелец информации (owner of information) - Субъект, в непосредственном ведении которого в соответствии с законом находится информация.
внетекстовые (внестраничные) критерии (off-page) – критерии ранжирования документов в поисковых системах, учитыващие факторы, не содержащиеся в тексте самого документа и не извлекаемые оттуда никаким образом.
Входная страница (мост-страница, дорвэй) - Страница сайта, оптимизированная под одну или несколько поисковых фраз с целью поднятия рейтинга в результатах поиска. Автоматически созданный дорвей содержит случайный текст, в котором периодически встречается нужная поисковая фраза, и потому не приносит посетителю никакой пользы. Созданный вручную дорвей может быть осмысленной страницей по узкой теме, полезной и нужной пользователя.
входные страницы (doorways, hallways) – страницы, созданные для искусственного повышения ранга в поисковых системах (поискового спама). При попадании на них пользователя перенаправляют на целевую страницу.
Гамма-коррекция - Алгоритм управления яркостью изображения, позволяющий добиться идентичности отображения графики на экранах компьютеров разных производителей.
Генеральная общедоступная лицензия (GNU, the General Public License) - Лицензия, по которой в Интернете распространяется практически все бесплатное программное обеспечение.
Гиперсреда (hypermedia) - Технология представления любых видов информации в виде относительно небольших блоков, ассоциативно связанных друг с другом посредством гипертекстовых технологий.
Гиперссылка (hyperlink) - Выделенный текст или изображение веб-страницы, устанавливающий связь с другим объектом (страницей). Обеспечивает навигацию в среде WWW.
Гипертекст (hypertext) - Документ, содержащий гиперссылки на блоки текста внутри самого документа или на другие документы.
Главная страница (home page) - Первая страница веб-узла. Несет основную презентационную и навигационную нагрузку.
Гостевая книга - Раздел web-сайта, снабженный специальной интерактивной формой, с помощью которой посетители данного ресурса могут оставить свои пожелания и предложения разработчикам или владельцам ресурса.
графематический анализ, лексический анализ, токенизация (tokenization, lexical analysis) – выделение в тексте слов, чисел, и иных токенов, в том числе, например, нахождение границ предложений.
Данлоад (download, скачивание) - Процесс копирования файлов с удаленного сетевого компьютера (сервера) на вызывающий компьютер (клиент).
Данные (data) - Информация, представленная в формализованном виде, пригодном для автоматизированной обработки.
Дизайн (design) - Вид художественно-проектной деятельности, сочетающей принципы удобства, экономичности и красоты. Каждый элемент дизайна согласуется с текстурой, фактурой, и цветом с другими элементами и внешней средой.
дизамбигуация, таггинг (tagging, part of speech disambiguation) - выбор одного из нескольких омонимов c помощью контекста; в английском языке часто сводится к автоматическому назначению грамматической категории «часть речи».
Динамический дизайн - Метод компоновки сайта, при котором его элементы изменяют свое положение в зависимости от настроек пользователя.
Динамический контент (dynamic content) – Переменная информация на веб-странице, изменяемая либо пользователем, либо загружаемая из базы данных.
Директ хит (direct Hit) – Программа, определяющая релевантность сайтов по количеству посещений и времени, проведенного на них пользователями. 
Домашняя страница (homepage) - Ресурс Интернета, представляющий рассказ о конкретном человеке, его образе жизни, хобби и увлечениях.
домен - это область пространства иерархических имен сети Интернет, которая обслуживается набором серверов доменных имен (DNS) и централизованно администрируется. Домен идентифицируется именем домена и в принципе является именем хоста.
Домен (domain) – Зона (сети), область (сети), имя (в сети). В Интернет домены определяются IP-адресами.
Доменное имя (DNS-адрес) - Адрес веб-ресурса в сети Интернет. Имя домена первого уровня может отражать географическое положение сервера либо тематику предоставляемой информации. Домен второго уровня выбирается организацией - хозяином веб-узла. Использование заглавных букв вместо строчных не меняет имени домена. Использование заглавных букв часто применяется в рекламных целях.
дубликаты (duplicates) – разные документы с идентичным, с точки зрения пользователя, содержанием.
Заголовки (H1…H6) – Форматирующие тэги, применяемые для выделения заголовков и подзаголовков текста. Размещение текста, содержащего ключевые слова, в заголовках повышает релевантность страницы в поисковой системе по этим словам.
иллюзия свежести– эффект кажущейся свежести, достигаемый поисковыми системами в интернете за счет более регулярного обхода тех документов, которые чаще находятся пользователями.
имя хоста - это уникальное имя устройства, подключённого к сети Интернет (которым может быть компьютер, файл- или веб-сервер, факс, IP-телефон, кабельный модем и т.д.).
Имя хоста используется для идентификации отдельного хоста в различных видах коммуникаций, таких как e-mail или WWW.
Имя хоста используется в разных системах именования (например, в NIS, DNS, SMB), поэтому значение термина "имя хоста" отличается в зависимости от системы именования.
инвертированный файл,инверсный файл, инвертированный индекс, инвертированный список (inverted file) – индекс поисковой системы, в котором перечислены слова коллекции документов, а для каждого слова перечислены все места, в которых оно встретилось.
Индекс - База данных поисковой машины, так называемый инвертированный индекс. Содержит словарь слов, встречающихся на интернет-страницах, с приписанными к ним списками адресов интернет-страниц, содержащих эти слова. Служит для поиска страниц с вхождениями заданных ключевых слов. Индекс пополняется поисковым роботом во время периодических обходов Интернета.
индекс цитирования (citation index) – число упоминаний (цитирований) научной статьи, в традиционной библиографической науке рассчитывается за промежуток времени, например, за год.
Индекс цитирования (link popularity) – Количество сайтов, которые ссылаются на данный сайт. Многие поисковые системы учитывают этот показатель при ранжировании результатов поиска.
Индексирование - Процесс обхода страниц сайта индексирующими роботами и помещения их в базу поисковой машины.
индексирование, индекс, индексация (indexing) – процесс составления или приписывания указателя (индекса) – служебной структуры данных, необходимой для последующего поиска. Латентно-семантическим индексированием называется запатентованный алгоритм поиска по смыслу, идентичный факторному анализу. Основан на сингулярном разложении матрицы связи слов с документами.
Интернет каталог - Каталоги, Интернет-каталоги - это большие сайты справочно-информационного характера, на которых пользователи сами могут найти сайты нужной тематики.
информационный поиск (Information Retrieval, IR) – поиск неструктурированной информации, единицой представления которой является документ произвольных форматов. Предметом поиска выступает информационная потребность пользователя, неформально выраженная в поисковом запросе. И критерий поиска, и его результаты недетермированы. Этими признаками информационный поиск отличается от «поиска данных», который оперирует набором формально заданных предикатов, имеет дело со структурированной информацией и чей результат всегда детерминирован. Теория информационного поиска изучает все составляющие процесса поиска, а именно, предварительную обработку текста (индексирование), обработку и исполнение запроса, ранжирование, пользовательский интерфейс и обратную связь.
ИЦ – Количество доменов, ссылающихся на сайт, рассчитанное по технологии компании Яндекс. Из общего числа доменов исключаются ссылки с сайтов, расположенных на бесплатных хостингах, ссылки из гостевых книг, форумов, ряда каталогов. Влияет на положение сайта в каталоге Яндекса.
Карта сайта (site map) - Страница сайта с его полной навигацией.
Карта ссылок (image map) – Графическое изображение, области которого являются гиперссылками.
Каталог (directory) – Специализированный сайт, представляющий собой систематизированную по тематическому принципу коллекцию ссылок на другие сайты.
Клик - Нажатие мышкой для перехода посетителя сайта по текстовой ссылке или баннеру на другую страницу или сайт.
Клоакинг (маскировка) - Способ работы веб-сервера, при котором пользователь, приходящий на страницы сайта, видит одно содержимое, а поисковая машина - другое. Клоакинг позволяет скрыть спам, благодаря которому страница находится высоко в результатах поиска, и выдать пристойное содержание пользователям.
Ключевое слово (keyword) – Слово, или фраза , которую пользователь вводит в форму поиска, когда ищет информацию по интересующей вас теме.
Ключевые слова (meta keywords tag) – Мета тэг в заголовке страницы, в котором перечисляются альтернативные ключевые слова - синонимы, транслитерации, перевод. Альтернативные ключевым словам, которые используются в тексте (body) страницы.
Конверсия - Отношение числа посетителей, воспользовавшихся предлагаемой на сайте услугой, к числу пользователей, пришедших на сайт.
Конкуренция по ключевым словам - Конкуренция предполагает выход на первые места в поисковых системах по заданным ключевым словам для привлечения потенциальных клиентов.
Контекстная реклама - Реклама, содержание которой зависит от запроса пользователя к поисковой системе. Её эффективность намного выше обычной. Подобная реклама обеспечивает лучшую конверсию посетителей в покупателей.
Контент (content) - Информация на сайте, любой связный и осмысленный текст.
лемматизация, нормализация (lemmatization) – приведение формы слова к словарному виду, то есть лемме.
маршрутизатор - узел, имеющий несколько IP-интерфейсов, подключенных к разным IP-сетям, осуществляющий, на основе решения задачи маршрутизации, перенаправление (ретрансляцию) данных из одной IP-сети в другую для доставки от отправителя к получателю.
Мета-теги – Команды для поисковой машины, находящиеся в тексте страниц, но не отображаемые пользователю в браузере. 
Модератор - Пользователь или штатный сотрудник сайта, следящий за порядком. Существуют также модераторы почтовых систем, основной задачей которых является борьба с почтовыми спаммерами.
Непотистский спам - Постановка ссылок для учёта их поисковыми серверами и увеличения значений ссылочной популярности, с целью повлиять на положение сайта в результатах поиска.
Обмен ссылками - Предоставление своей ссылки в сиcтему обмена ссылками с тематическими сайтами с целью повышение индекса цитируемости сайта.
Обмен статьями - Способ обмена контентом с целью повышения поисковой эффективности. Предоставление своей специально подготовленной рекламной статьи в систему обмена позволяет обмняться и контентом и ссылками одновременно.
обратная встречаемость или частота в документах (inverted document frequency, IDF) – показатель поисковой ценности слова (его различительной силы); обратная говорят, потому что при вычислении этого показателя в знаменателе дроби обычно стоит число документов, содержащих данное слово.
обратная связь, псевдо-обратная связь – отклик пользователей на результат поиска, их суждения о релевантности найденных документов, зафиксированные поисковой системой и использующиеся, например, для итеративной модификации запроса. Следует отличать от псевдо-обратной связи – техники модификации запроса, в которой несколько первых найденных документов автоматически считаются релевантными.
Описание страницы (meta description tag) – Мета тэг в заголовке страницы, в который заносится краткая аннотация содержания. Некоторые поисковые системы отображают описание в результатах поиска, точная и корректная аннотация привлекает посетителей.
Оптимизация архитектуры сайта - Изменение текущей навигации и систематизации информации на сайте с целью обеспечить посетителям успешно нахождение нужных им данных, увеличения посещаемости сайта, создания и увеличения ядра постоянной аудитории.
основа – часть слова, общая для набора его словообразовательных и словоизменительных (чаще) форм.
Плата за клик (pay per click search engine) – Существуют поисковые системы, в которой положение ссылки в листе ответов зависит от платы за каждого посетителя, пришедшего на сайт с данной системы.
Плотность ключевого слова (keyword frequency) – Показатель, учитывающий, не только сколько раз встречается ключевое слово на странице, но и как часто оно используется в определенном объеме текста. Превышение плотности может быть расценен поисковой системой как спамдексинг, и страница может быть исключена из индекса.
подпись, сигнатура (signature) – множество хеш-значений слов некоторого блока текста. При поиске по методу сигнатур все сигнатуры всех блоков коллекции просматриваются последовательно в поисках совпадений с хеш-значениями слов запроса.
Позиционирование в поисковой системе (search engine placement) – действия, предпринятые с целью обеспечить попадание сайта на первые позиции в листах ответов поисковой системы.
поиск по смыслу – алгоритм информационного поиска, способный находить документы, не содержащие слов запроса.
поиск похожих документов (similar document search) – задача информационного поиска, в которой в качестве запроса выступает сам документ и необходимо найти документы, максимально напоминающие данный.
Поисковая машина - Также поисковая система, поисковик - программно-аппаратный комплекс, предназначенный для осуществления поиска в Интернете и реагирующий на запрос пользователя, задаваемый текстовой фразой, выдачей набора ссылок на страницы и сайты, соответствующего запросу.
поисковая система, информационно-поисковая система, ИПС, поисковая машина, машина поиска, «поисковик» (search engine, SE) – программа, предназначенная для поиска информации, обычно текстовых документов.
поисковый запрос, предписание (query) – обычно строчка текста.
Поисковый робот - Программа, являющаяся составной частью поисковой машины, и предназначенная для обхода страниц Интернета с целью занесения их в базу. Порядок обхода страниц, частота визитов регулируется алгоритмами поисковой машины.
Поисковый спам - Различные методы обмана поисковых систем и их посетителей, с целью повышения ранга страницы в результатах поиска.
Показ - Просмотр страницы пользователем.: а) Подразумевается демонстрация ссылки или рекламного баннера пользователю, включая многократный показ, вследствие перезагрузки страницы; б) Понятие уникального показа - количество уникальных пользователей, просмотревших страницу или рекламный материал.
полисемия, омонимия, многозначность, омография (polysemy, homography) - наличие нескольких значений у одного и того же слова.
полнота, охват (recall) – доля релевантного материала, заключенного в ответе поисковой системы, по отношению ко всему релевантному материалу в коллекции.
Положение ключевого слова на странице (keyword prominence) – Показатель, учитывающий, как близко к началу страницы находится заданное ключевое слово. Чем ближе к началу страницы встречается слово запроса, тем релевантнее считается данная страница по данному слову.
Популярные запросы посетителей - Наиболее частые запрос пользователей, слова и словосочетания, фразы, задаваемые пользователями Интернет поисковым машинам в целях нахождения нужной информации.
порт (номер порта) - число, идентифицирующее прикладной процесс для протоколов транспортного уровня (TCP, UDP).
Посещаемость (сайта, ресурса, портала, страницы, Интернет-проекта) - Количество посещений сайта за определенный период времени с учетом уникальных посетителей.
Постоянная аудитория - Некоторая постоянная группа людей (ядро аудитории), которые периодически возвращаются на веб-сайт.
приблизительные дубликаты (near duplicates) - в отличие от точных дубликатов, содержат незначительные отличия.
Продвижение - Также поисковая оптимизация сайта, также "раскрутка" сайта, оптимизация сайта, Search Engines Optimization (SEO) - набор действий по изменению сайта и элементов внешней среды с целью получения высоких мест в результатах поиска по заданным запросам.
Промоутер – Отдельная персона или компания, занимающиеся продвижением сайта в Интернете.
прюнинг (pruning) – отсечение заведомо нерелевантных документов при поиске с целью ускорения выполнения запроса.
Прямая ссылка - Это внешняя ссылка, которая непосредственно ведет на сайт и которую учитывает поисковый робот.
прямой поиск – поиск непосредственно по тексту документов, без предварительной обработки (без индексирования).
Раздел сайта - Раздел сайта группирует информацию общей или схожей тематики. В некоторых случаях раздел может состоять только из одной страницы.
различительная сила слова или контрастность термина (term specificity, term discriminating power) – степень ширины или узости слова. Слишком широкие термины в поиске приносят слишком много информации, при это существенная часть ее бесполезна. Слишком узкие термины помогают найти слишком мало документов, хотя и более точных.
Ранг (важность) страницы - Алгоритм расчёта авторитетности/важности страницы, а также сам показатель авторитетности в численном выражении.
Ранжирование - Процесс выбора страниц из базы поисковой машины, соответствующих запросу пользователя, и упорядочение их по степени убывания соответствия (релевантности) запросу.
Раскрутка – То же значение, что и поисковая оптимизация сайта, также "продвижение" сайта, оптимизация сайта.
регулярное выражение, шаблон, маска (regualr expression, pattern) – способ записи поискового предписания, позволяющий определять пожелания к искомому слову, его возможные написания, ошибки и т.д. В широком смысле – язык, позволяющий задавать запросы неограниченной сложности.
Редирект (redirect, перенаправление) - Программное решение или скрипт, который принудительно перенаправляет пользователя с выбранной страницы на другую страницу.
Результаты поиска (SERP, search engine result page) - Страница, выдаваемая поисковой системой в качестве ответа на запрос пользователя, и содержащая набор ссылок на страницы Интернета, соответствующие, по мнению алгоритма поисковой машины, заданному запросу (релевантные ему).
релевантность (relevance, relevancy) – соответствие документа запросу.
Релевантность (relevant, относящийся к делу) - Обозначает соответствие найденного документа запросу, сделанному пользователем поисковой системы.
Ресурс - Тоже что и сайт, портал, Интернет-проект– дословно «узел сети».
Рунет - Русский Интернет. Этот термин используется для обозначения множества сайтов, находящихся в доменной зоне.ru. В связи с развитием национальных доменных зон, им можно обозначить также множество сайтов, для которых русский язык является основным, либо одним из основных.
Сайт (site) – дословно «узел сети».
Семантический анализ - Логический анализ деятельности фирмы для создания семантического ядра с целью привлечения целевых клиентов.
Семантическое ядро - Библиотека слов и фраз, которые наиболее точно характеризуют и отражают вид деятельности либо товары/услуги, предлагаемые на рынке.
Скрытый текст (hidden text) – Текст, “видимый” поисковому роботу, но невидимый для читателя. Цвет текста совпадает с цветом фона. Главным образом применяется для повышения частоты ключевых слов на странице без нарушения ее дизайна.
словоизменение (inflection) – образование формы определенного грамматического значения, обычно обязательного в данном грамматическом контексте, принадлежащей к фиксированному набору форм (парадигме), характерного для слов данного типа. В отличие от словообразования никогда не приводит к смене типа и порождает предсказуемое значение. Словоизменение имен называют склонением (declension), а глаголов – спряжением (conjugation).
словообразование (derivation) – образование слова или основы из другого слова или основы. Чаще приводит к смене типа и к образованию слов, имеющих идеосинкразическое значение.
Словоформа - Одна из косвенных форм слова, полученная из нормальной формы слова с помощью склонения или спряжения. 
сокет - пара, состоящая из IP-адреса интерфейса узла и номера порта. Идентифицирует в Интернет прикладной процесс, выполняемый на данном узле и получающий или отправляющий данные через данный IP-интерфейс.
спам поисковых систем, накрутка поисковых систем, спамдексинг (spam) – попытка воздействовать на результат информационного поиска со стороны авторов документов. К спаму относится также клоакинг (cloaking) – техника поискового спама, состоящая в распознании авторами документов робота (индексирующего агента) поисковой системы и генерации для него специального содержания, принципиально отличающегося от содержания, выдаваемого пользователю. Ещё одним видом спама является непотизм: – вид спама поисковых систем, установка авторами документов взаимных ссылок с единственной целью поднять свой ранг в результатах поиска.
Спам, спамминг (spamming) – Использование методов, приводящих к искажению и ухудшению результатов ответов поисковой системы на запросы пользователей. Называется также спамдексинг. В ином значении, спам – это рассылка незапрашиваемых адресатом почтовых сообщений.
Спамдексинг (spamdexing) – спам поисковых систем.
Ссылающийся сайт (ресурс, портал, страница, Интернет-проект) - Сайт, разместивший ссылку на другой ресурс, увеличив тем самым Индекс Цитирования на другого сайта.
Ссылочная популярность (link popularity) - Общее название технологий, позволяющих, при расчёте релевантности документа определённому запросу, учитывать авторитетность документа - наличие в Сети ссылок на этот документ или домен, на котором он находится, и текст этих ссылок. Существует несколько реализаций ссылочной популярности - PageRank (Google), ВИЦ и тИЦ (Яндекс), ИЦ (Апорт).
статическая популярность (PageRank) – алгоритм расчета статической (глобальной) популярности страницы в интернете, назван в честь одного из авторов - Лоуренса Пейджа. Соответствует вероятности попадания пользователя на страницу в модели случайного блуждания.
стемминг – поцесс выделения основы слова.
стоп-слова (stop-words) – те союзы, предлоги и другие частотные слова, которые данная поисковая система исключила из процесса индексирования и поиска для повышения своей производительности и/или точности поиска.
Стоп-слова - Служебные единицы языка, не несущие самостоятельной смысловой нагрузки. К ним относятся предлоги, союзы, междометия и т.д.Удаляются поисковой машиной из образа индексируемой страницы с целью снижения нагрузки на поисковый сервер и уменьшения размеров индекса.
суффиксные деревья, суффиксные массивы (suffix trees, suffix arrays, PAT-arrays) – индекс, основанный на представлении всех значимых суффиксов текста в структуре данных, известной как бор (trie). Суффиксом в этом индексе называю любую «подстроку», начинающуюся с некоторой позиции текста (текст рассматривается как одна непрерывная строка) и продолжающуюся до его конца. В реальных приложениях длина суффиксов ограничена, а индексируются только значимые позиции – например, начала слов. Этот индекс позволяет выполнять более сложные запросы, чем индекс, построенный на инвертированных файлах.
тВИЦ, Тематический ВИЦ - Взвешенный индекс цитирования Яндекса, рассчитанный с учётом соответствия тематики сайтов, ссылающихся на данный, тематике данного сайта.
Титул, содержимое тега title- Отображается в качестве заголовка окна браузера при демонстрации страницы и в качестве заголовка найденной страницы в результатах поиска.
Точка входа - Страница сайта, на которую зашел новый посетитель ресурса. Точка входа важна для анализа привлекательности оптимизированных страниц.
Точка выхода - Страница сайта, с которой посетитель ресурса покинул сайт после просмотра. Точка выхода важна для анализа привлекательности всего сайта.
точность (precision) - доля релевантного материала в ответе поисковой системы.
Тэг комментария - Текст, размещенный в коде веб-страницы как комментарий (<--- … --->), не отображается в браузере. Большинство поисковых систем игнорируют текст внутри комментария.
узел - компьютер, имеющий IP-интерфейсы, подсоединенные к одной или нескольким IP-сетям.
Уникальный посетитель - Термин для обозначения пользователя сети Интернет, совершившего визит на сайт с конкретного компьютера, с помощью определённого программного обеспечения (браузера), впервые в течение определённого срока (суток, последнего часа и т.п.).
Флэш (flash) - Дополнительный бесплатный модуль к браузеру (плагин), разработанный компанией Macromedia, который даёт возможность просматривать страницы и их элементы в формате Flash.
Фрейм - Часть веб-страницы, построенной на основе фреймов. Идеология фреймов напоминает окна операционной системы, привязанные к одному месту веб-страницы - пользователь может менять любое из окон, в то время как остальные остаются неизменными. Фреймы предназначены для сайтов со сложной навигацией. Большинство поисковых систем некорректно индексируют фреймы.
хеш-значение (hash-value) – значение хеш-функции (hash-function), преобразующей данные произвольной длины (обычно, строчку) в число фиксированного порядка.
Хит - Обращение браузера к веб-серверу. Обычно употребляется в более узком смысле - обращение к веб-странице (документу типа .html, .php, .cgi, .asp и т.д.), исключая, таким образом, запросы к файлам, содержащим графические изображения, служебные запросы и т.д.
Холл (hallway page) - Страница, содержащая обратные связи к входным страницам.
Целевая аудитория - Некоторая группа людей, которая проявляет заинтересованность услугами (товарами, содержанием сайта и т.д.), т.е. представляет собой потенциальных клиентов.
Целевой переход - Переход по ссылке на ресурс, интересующий потенциального клиента (пользователя).
Целевые посетители - Посетители сайта, являюшиеся потенциальными клиентами, то есть людьми, желаюшими сделать ту или иную покупку.
частота (слова) в документах, встречаемость в документах, документная частота (document frequency) – число документов в коллекции, содержащих данное слово.
Частота ключевого слова (keyword frequency) – Встречаемость, частота использования. Сколько раз встречается данное ключевое слово на странице.
частота термина (term frequency, TF) – частота употреблений слова в документе.
шингл (shingle) – хеш-значение непрерывной последовательности слов текста фиксированной длины.
шлюз - маршрутизатор, соединяющий: а) две IP-сети с различными физическими каналами передачи данных; б) клиентскую IP-сеть с вышестоящей внешней IP-сетью (провайдером).
Ядро аудитории - Постоянные посетители, заинтересованные в услугах, товарах или содержании сайта.
Я не в коей мере не претендую на авторство описаний понятий, присутствующих на данной странице, т.к. вся инормация была взята в Интернете из различных открытых источников.
|
|
|