Что такое поисковая система?
---
Ну что за странный вопрос, скажете вы. Поисковая система - это Яндекс и Google :) И будете правы, в какой-то степени. Ведь кроме Яндекса с Гуглом есть еще поисковые системы: Mail.ru, Bing, Yahoo и еще несколько гораздо менее популярных. Просто доля Яндекса и Гугла в России сильно больше всех остальных. В Рунете аудитория Яндекса и Google в наши дни различаются не сильно (хотя Яндекс долгое время был лидером). По всему миру, конечно, рулит Google.
Фото: Центр космической связи "Дубна"
Не всегда было так. Когда только возник массовый интернет, сайтов было очень мало. Их адреса можно было запомнить наизусть. В начале 90-ых годов сайты начали возникать как грибы после дождя. Вэбмастеры задумались о том, чтобы создать реестр сайтов, разделенный по тематикам. Так родились каталоги сайтов. У Яндекса, Rambler и Mail.ru, наряду с поисковой системой, есть еще и обычные каталоги сайтов с внутренним рейтингом. Самый известный, большой и авторитетный каталог сайтов во всем интернете на сегодняшний день – это DMOZ. Он был запущен в 1998 году, и до сих пор пополняется сайтами на 90 языках мира.
Скриншот главной страницы Яндекс.Каталога - https://yandex.ru/yaca
Владельцы сайтов или другие люди заносили информацию о сайтах в каталог вручную, заполняя поля типа:
название;
адрес;
краткое описание;
категория.
В каталогах, как правило, есть возможность поиска среди сайтов, занесенных туда. Ну, или можно было просто листать список сайтов по категориям.
Каталоги – это простой реестр сайтов, где содержится только базовая информация о сайтах, разделенных на категории (рубрики).
У каталогов есть один огромный недостаток – они не позволяют искать информацию внутри текстов каждого сайта. Поэтому создание полноценных поисковых систем, вроде Яндекса и Гугла, было встречено с энтузиазмом. Самой первой поисковой машиной в мире считается некий Wandex, его запустили в 1993 году. Он, кстати, до сих пор работает. Старожилы интернета должны помнить поисковики Aliweb, WebCrawler, Lycos, Infoseek (а вы помните? :)). Первой поисковой системой, которая нормально искала в Рунете, можно считать Altavista (сейчас он принадлежит Yahoo). Первыми российскими поисковиками стали Рамблер и Апорт. Обе не дожили до наших дней в первоначальном виде. Рамблер теперь пользуется поисковой технологией Яндекса, а Апорт вообще перестал быть поисковой системой и превратился в агрегатор товаров.
Переломным моментом в истории поисковых систем считают 1997 год, когда были анонсированы и запущены Яндекс и Google. Именно эти поисковики в наше время занимают приличную долю. Именно под них оптимизаторы стараются модифицировать сайты. Именно в них владельцы сайтов хотят быть выше всех :)
Чем же принципиально отличались поисковые системы от каталогов? Смысл поисковиков в том, что они сами сканируют интернет на предмет появления новых сайтов, новых страниц внутри каждого сайта, и даже новых текстов на отдельных страницах. Они хранят в своей базе не только название и адрес сайта, но и содержимое всех его страниц. Это позволяет пользователям интернета задавать конкретные поисковые запросы, и получать в ответ конкретные страницы сайтов.
Как это происходит? Ну вот появился новый сайт. У поисковых систем есть сервисы, которых называют роботами или ботами или пауками. Эти самые роботы находят новый сайт (автоматически, или по наводке вэбмастера/сеошника), и дают команду на занесение страниц сайта в свою базу, которую по-умному называют «индекс». А процесс занесения в базу называется «индексирование» или «индексация». Про это очень важное свойство поисковых машин я еще буду не раз вспоминать.
Роботы/боты/пауки – это активная часть поисковой системы, которая обходит сайты в интернете, сканирует сайты и страницы, потом заносит всю информацию в базу поисковика. Они могут делать это автоматически, можно только некоторыми действиями ускорить этот процесс.
Индекс – это база данных поисковых систем, где хранится информация про сайты, их страницы и весь контент на них. Благодаря индексу, информация по миллионам сайтов находится за доли секунды.
Индексация – процесс сканирования сайта пауками и занесения информации в базу (индекс). Переиндексация, соответственно, повторная индексация страницы с целью обновления данных в индексе.
Во время индексирования пауки поисковой системы сканируют все файлы (страницы) сайта, извлекают из него все тексты, ссылки, а также информация о картинках, аудио и видеофайлах. Самое важное тут – это то, что поисковики копируют всю текстовую информацию в соответствие со структурой сайта. Все красивости сайта поисковику незачем. Поисковик видит сайты "голыми", без визуальных эффектов. После сканирования, вся информация аккуратно раскладывается по полочкам в базе поисковой системы. Каждой странице вашего сайта присваивается ряд важных показателей, по которым они будут показываться в поисковой выдаче (еще говорят, ранжироваться в выдаче). Про эти показатели тоже позже отдельно, не стоит пока забивать себе голову.
Поисковый запрос – это слово или словосочетание, которое пользователь вбивает в строку поиска.
Поисковая выдача – это страница поисковой системы с результатами поиска по запросу. Всю выдачу делят на две части: коммерческую (платная контекстная реклама) и органическую (естественный результат поиска).
Ранжирование – это построение сайтов в поисковой выдаче.
Ниже пример поисковой выдачи по запросу "центр космической связи Дубна". Мой пост в топе 5, после википедии :)
Главное, нужно понимать, что для начала продвижения сайта нужно обеспечить выполнение минимум двух условий:
На страницах сайта должен быть тот контент (текст, фото, видео, аудио), по котором вы хотите показываться в поиске.
Сайт, или отдельные его страницы, должны быть проиндексированы, то есть, занесены в базу (индекс) поисковой системы.
Тут я совсем чуть-чуть затронул суть SEO. Подробнее об это позже. А я расскажу еще одну довольно очевидную, но важную вещь.
Поисковые системы созданы для того, чтобы зарабатывать на них деньги. Это ясно, как день. Чем больше людей пользуется той или иной поисковой системой, тем больше денег можно на ней заработать. Самая очевидная статья дохода поисковой системы – это контекстная реклама (у яндекса это Яндекс.Директ, у Google это Adwords). Про контекстную рекламу немного напишу в поздних постах.
На картинке ниже красным отмечена контекстная текстовая реклама (коммерческая выдача), коричневым - контекстный баннер (тоже коммерческая выдача), синим - первые два пункта органической поисковой выдачи:
Контекстная реклама – это вид рекламы, которая показывается в зависимости от введенного поискового запроса. Блоки контекстной рекламы видны выше, ниже или сборку от поисковой выдачи. Оплата за размещение такой рекламы, как правило, за каждый клик.
Очевидно, что между поисковиками существует конкуренция. Для чего? Чтобы больше людей видели именно их блоки контекстной рекламы. Как они конкурируют и привлекают к себе посетителей? Ну, например, всякими полезными бесплатными сервисами: почта, карты, музыка, новости, справочники, переводчики, электронные деньги и прочее. Но есть еще одна важная вещь – это обеспечение качественного поиска по сайтам в интернете. Принцип действия у всех поисковиков примерно одинаковый, а вот результаты на одни и те же запросы могут выдавать разные. Вы, наверняка, слышали фразы типа "Яндекс плохо ищет, мне нравится Гугл" или наоборот. Вот оно!
Поэтому разработчики поисковых систем постоянно работают над улучшением поиска по сайтам, чтобы обеспечить хорошее качество и не разочаровывать пользователей. Например, если я написал в поисковой строке "драйвера для ноутбука HP 250", то ожидаю сайты со ссылками на драйвера, а не сайт сервис-центра или фишинговую страницу в духе «Введи номер телефона и скачай драйвер» (никогда не вводите номер телефона на подозрительных сайтах!). Вы, наверняка, сами вспомните несколько эпизодов, когда ожидаешь одно, а получаешь другое. Особенно когда ищешь довольно редкие вещи, например, непопулярные книги или драйвера для компьютерного железа. В таком случае задумываешься о том, чтобы сменить поисковую систему.
К чему это я? В идеальном мире все создатели сайтов белые и пушистые. На их сайтах только правдивая информация, которая соответствует тематике сайта и страницы. Но мы живем в жестоком мире. Люди манипулируют своими сайтами, чтобы привлечь как можно больше посетителей из поисковиков. И иногда делают это нечестными способами, что ухудшает качество поисковой выдачи. А это плохо для репутации поисковиков. Нельзя допустить, чтобы сайты с некачественным и нетематическим контентом, или даже сайты мошенников, оказались выше хороших сайтов. Это главная цель тех, кто отвечает за разработку поисковых систем. Они в последние несколько лет делают в этом большие успехи, назло мошенникам и "черным" оптимизаторам.
Важно запомнить эту простую истину. Это сильно поможет в понимании смысла правильной поисковой оптимизации и результативного продвижения. Не надо пытаться обмануть поисковые системы. Напротив, нужно "подружить" ваш сайт с ними. А как это сделать – поговорим в посте про SEO.
Все, что я рассказал выше про поисковые системы, конечно, сильно упрощено. Напомню, мои посты предназначены для тех, кто хочет разобраться в основах и базовых вещах с нуля. Поэтому я буду писать только то, что реально важно для понимания этих самых основ. Обратите внимание на термины и их разъяснения курсивом. Вам нужно понимать хотя бы что это такое в целом.
Я все понятно написал? Эти посты – чистый экспромт, у меня нет заранее заготовленного плана. Поэтому мне важно знать, в правильном ли я направлении, нужно ли что-то менять, чтобы было понятнее? Если что-то неясно – не стесняйтесь, обязательно спрашивайте!
Подписывайтесь на мой блог, добавляйтесь в друзья в соц. сетях, рекомендуйте своим друзьям. Лайки, шеры и комменты будут мотивировать меня писать больше, чаще и лучше. Вашим друзьям это все тоже нужно знать. Ну и задавайте вопросы, если есть. Либо отвечу сразу, либо постараюсь учесть в будущих постах.
Фото: Центр космической связи "Дубна"
Не всегда было так. Когда только возник массовый интернет, сайтов было очень мало. Их адреса можно было запомнить наизусть. В начале 90-ых годов сайты начали возникать как грибы после дождя. Вэбмастеры задумались о том, чтобы создать реестр сайтов, разделенный по тематикам. Так родились каталоги сайтов. У Яндекса, Rambler и Mail.ru, наряду с поисковой системой, есть еще и обычные каталоги сайтов с внутренним рейтингом. Самый известный, большой и авторитетный каталог сайтов во всем интернете на сегодняшний день – это DMOZ. Он был запущен в 1998 году, и до сих пор пополняется сайтами на 90 языках мира.
Скриншот главной страницы Яндекс.Каталога - https://yandex.ru/yaca
Владельцы сайтов или другие люди заносили информацию о сайтах в каталог вручную, заполняя поля типа:
название;
адрес;
краткое описание;
категория.
В каталогах, как правило, есть возможность поиска среди сайтов, занесенных туда. Ну, или можно было просто листать список сайтов по категориям.
Каталоги – это простой реестр сайтов, где содержится только базовая информация о сайтах, разделенных на категории (рубрики).
У каталогов есть один огромный недостаток – они не позволяют искать информацию внутри текстов каждого сайта. Поэтому создание полноценных поисковых систем, вроде Яндекса и Гугла, было встречено с энтузиазмом. Самой первой поисковой машиной в мире считается некий Wandex, его запустили в 1993 году. Он, кстати, до сих пор работает. Старожилы интернета должны помнить поисковики Aliweb, WebCrawler, Lycos, Infoseek (а вы помните? :)). Первой поисковой системой, которая нормально искала в Рунете, можно считать Altavista (сейчас он принадлежит Yahoo). Первыми российскими поисковиками стали Рамблер и Апорт. Обе не дожили до наших дней в первоначальном виде. Рамблер теперь пользуется поисковой технологией Яндекса, а Апорт вообще перестал быть поисковой системой и превратился в агрегатор товаров.
Переломным моментом в истории поисковых систем считают 1997 год, когда были анонсированы и запущены Яндекс и Google. Именно эти поисковики в наше время занимают приличную долю. Именно под них оптимизаторы стараются модифицировать сайты. Именно в них владельцы сайтов хотят быть выше всех :)
Чем же принципиально отличались поисковые системы от каталогов? Смысл поисковиков в том, что они сами сканируют интернет на предмет появления новых сайтов, новых страниц внутри каждого сайта, и даже новых текстов на отдельных страницах. Они хранят в своей базе не только название и адрес сайта, но и содержимое всех его страниц. Это позволяет пользователям интернета задавать конкретные поисковые запросы, и получать в ответ конкретные страницы сайтов.
Как это происходит? Ну вот появился новый сайт. У поисковых систем есть сервисы, которых называют роботами или ботами или пауками. Эти самые роботы находят новый сайт (автоматически, или по наводке вэбмастера/сеошника), и дают команду на занесение страниц сайта в свою базу, которую по-умному называют «индекс». А процесс занесения в базу называется «индексирование» или «индексация». Про это очень важное свойство поисковых машин я еще буду не раз вспоминать.
Роботы/боты/пауки – это активная часть поисковой системы, которая обходит сайты в интернете, сканирует сайты и страницы, потом заносит всю информацию в базу поисковика. Они могут делать это автоматически, можно только некоторыми действиями ускорить этот процесс.
Индекс – это база данных поисковых систем, где хранится информация про сайты, их страницы и весь контент на них. Благодаря индексу, информация по миллионам сайтов находится за доли секунды.
Индексация – процесс сканирования сайта пауками и занесения информации в базу (индекс). Переиндексация, соответственно, повторная индексация страницы с целью обновления данных в индексе.
Во время индексирования пауки поисковой системы сканируют все файлы (страницы) сайта, извлекают из него все тексты, ссылки, а также информация о картинках, аудио и видеофайлах. Самое важное тут – это то, что поисковики копируют всю текстовую информацию в соответствие со структурой сайта. Все красивости сайта поисковику незачем. Поисковик видит сайты "голыми", без визуальных эффектов. После сканирования, вся информация аккуратно раскладывается по полочкам в базе поисковой системы. Каждой странице вашего сайта присваивается ряд важных показателей, по которым они будут показываться в поисковой выдаче (еще говорят, ранжироваться в выдаче). Про эти показатели тоже позже отдельно, не стоит пока забивать себе голову.
Поисковый запрос – это слово или словосочетание, которое пользователь вбивает в строку поиска.
Поисковая выдача – это страница поисковой системы с результатами поиска по запросу. Всю выдачу делят на две части: коммерческую (платная контекстная реклама) и органическую (естественный результат поиска).
Ранжирование – это построение сайтов в поисковой выдаче.
Ниже пример поисковой выдачи по запросу "центр космической связи Дубна". Мой пост в топе 5, после википедии :)
Главное, нужно понимать, что для начала продвижения сайта нужно обеспечить выполнение минимум двух условий:
На страницах сайта должен быть тот контент (текст, фото, видео, аудио), по котором вы хотите показываться в поиске.
Сайт, или отдельные его страницы, должны быть проиндексированы, то есть, занесены в базу (индекс) поисковой системы.
Тут я совсем чуть-чуть затронул суть SEO. Подробнее об это позже. А я расскажу еще одну довольно очевидную, но важную вещь.
Поисковые системы созданы для того, чтобы зарабатывать на них деньги. Это ясно, как день. Чем больше людей пользуется той или иной поисковой системой, тем больше денег можно на ней заработать. Самая очевидная статья дохода поисковой системы – это контекстная реклама (у яндекса это Яндекс.Директ, у Google это Adwords). Про контекстную рекламу немного напишу в поздних постах.
На картинке ниже красным отмечена контекстная текстовая реклама (коммерческая выдача), коричневым - контекстный баннер (тоже коммерческая выдача), синим - первые два пункта органической поисковой выдачи:
Контекстная реклама – это вид рекламы, которая показывается в зависимости от введенного поискового запроса. Блоки контекстной рекламы видны выше, ниже или сборку от поисковой выдачи. Оплата за размещение такой рекламы, как правило, за каждый клик.
Очевидно, что между поисковиками существует конкуренция. Для чего? Чтобы больше людей видели именно их блоки контекстной рекламы. Как они конкурируют и привлекают к себе посетителей? Ну, например, всякими полезными бесплатными сервисами: почта, карты, музыка, новости, справочники, переводчики, электронные деньги и прочее. Но есть еще одна важная вещь – это обеспечение качественного поиска по сайтам в интернете. Принцип действия у всех поисковиков примерно одинаковый, а вот результаты на одни и те же запросы могут выдавать разные. Вы, наверняка, слышали фразы типа "Яндекс плохо ищет, мне нравится Гугл" или наоборот. Вот оно!
Поэтому разработчики поисковых систем постоянно работают над улучшением поиска по сайтам, чтобы обеспечить хорошее качество и не разочаровывать пользователей. Например, если я написал в поисковой строке "драйвера для ноутбука HP 250", то ожидаю сайты со ссылками на драйвера, а не сайт сервис-центра или фишинговую страницу в духе «Введи номер телефона и скачай драйвер» (никогда не вводите номер телефона на подозрительных сайтах!). Вы, наверняка, сами вспомните несколько эпизодов, когда ожидаешь одно, а получаешь другое. Особенно когда ищешь довольно редкие вещи, например, непопулярные книги или драйвера для компьютерного железа. В таком случае задумываешься о том, чтобы сменить поисковую систему.
К чему это я? В идеальном мире все создатели сайтов белые и пушистые. На их сайтах только правдивая информация, которая соответствует тематике сайта и страницы. Но мы живем в жестоком мире. Люди манипулируют своими сайтами, чтобы привлечь как можно больше посетителей из поисковиков. И иногда делают это нечестными способами, что ухудшает качество поисковой выдачи. А это плохо для репутации поисковиков. Нельзя допустить, чтобы сайты с некачественным и нетематическим контентом, или даже сайты мошенников, оказались выше хороших сайтов. Это главная цель тех, кто отвечает за разработку поисковых систем. Они в последние несколько лет делают в этом большие успехи, назло мошенникам и "черным" оптимизаторам.
Важно запомнить эту простую истину. Это сильно поможет в понимании смысла правильной поисковой оптимизации и результативного продвижения. Не надо пытаться обмануть поисковые системы. Напротив, нужно "подружить" ваш сайт с ними. А как это сделать – поговорим в посте про SEO.
Все, что я рассказал выше про поисковые системы, конечно, сильно упрощено. Напомню, мои посты предназначены для тех, кто хочет разобраться в основах и базовых вещах с нуля. Поэтому я буду писать только то, что реально важно для понимания этих самых основ. Обратите внимание на термины и их разъяснения курсивом. Вам нужно понимать хотя бы что это такое в целом.
Я все понятно написал? Эти посты – чистый экспромт, у меня нет заранее заготовленного плана. Поэтому мне важно знать, в правильном ли я направлении, нужно ли что-то менять, чтобы было понятнее? Если что-то неясно – не стесняйтесь, обязательно спрашивайте!
Подписывайтесь на мой блог, добавляйтесь в друзья в соц. сетях, рекомендуйте своим друзьям. Лайки, шеры и комменты будут мотивировать меня писать больше, чаще и лучше. Вашим друзьям это все тоже нужно знать. Ну и задавайте вопросы, если есть. Либо отвечу сразу, либо постараюсь учесть в будущих постах.
Взято: unis.livejournal.com
Комментарии (0)
{related-news}
[/related-news]