Использование Google Data Mine

Anonim

Вы сегодня погуглили? Вы попали на эту страницу, "гуглив"?

Если это так, то вы видели будущее и являетесь его частью, даже если вы еще не осознали его. На самом деле в Google происходит гораздо больше, чем просто поиск. Я собираюсь рассказать о том, что делает Google, знает, а также о том, что вы должны делать и знать, чтобы извлечь из этого максимум пользы.

$config[code] not found

Действительно, Google наиболее известен своей мощной поисковой системой, которая опирается на обширную базу данных веб-страниц, видео, изображений, биржевых котировок, телефонных номеров, адресов и других блоков мультимедиа и данных, чтобы предоставить соответствующую информацию - все в время, необходимое, чтобы ударить ключ.

Название крупнейшей в мире поисковой системы стало синонимом поиска в Интернете. Это даже стало глаголом в нашем повседневном языке (хотя Google не нравится, когда мы его так используем): мы «гуглим» автомобильные обзоры, текущий адрес нашего друга детства, а сами в полетах фантазии и величия.

Легко забыть, что мы не одиноки, когда ищем. Все, что мы делаем в среде Google (и некоторые вещи, которые мы делаем вне ее), записывается, хранится и анализируется. Как только вы узнаете, что компания располагает таким большим количеством данных, вам не понадобится много времени, чтобы понять, что всю эту информацию можно использовать не только для приятного поиска.

Чтобы полностью понять потенциальную мощь Google, откиньтесь на мгновение и рассмотрите, как Google работает, более подробно. Как работает Google

Для обычного пользователя не сразу видно, как Google ищет Интернет так быстро и с такими хорошими результатами. Секрет в том, что когда вы вводите запрос, они вообще не ищут в Интернете; вместо этого Google ищет базу данных, которая постоянно растет и обновляется, 24 часа в сутки, 7 дней в неделю.

Все это происходит без вмешательства человека. Крошечные программы, называемые «пауками» или «сканерами», независимо друг от друга следуют по ссылкам с одной страницы на другую, подобно тому, как паук следит за потоками своей сети. По мере того, как пауки ползают по веб-страницам, они собирают информацию о каждом предложении, изображении, номере телефона и обо всем, с чем они могут столкнуться. Они сканируют каждую страницу, которую посещают, индексируют ключевые слова и отмечают ссылки на и со страницы. Затем эта информация хранится в огромной базе данных. Те же ссылки и страницы сканируются снова и снова, обеспечивая постоянную актуальность информации Google.

Google ранжирует страницы, используя информацию, которую собирают пауки. В этот процесс ранжирования включены следующие:

  • частота и местоположение ключевых слов (чем больше ключевых слов в более заметных местах, тем лучше);
  • возраст страницы (чем более устоявшаяся страница, тем лучше);
  • количество страниц, ссылающихся на страницу (чем больше ссылок, тем лучше).

Google учитывает и другие факторы, но они держатся в секрете, чтобы мешать тем, кто пытается играть в систему и получать высокие оценки, фактически не предоставляя полезную информацию. Кроме того, если вы переусердствуете и просто заполняете свою страницу избыточной информацией, списками ключевых слов и нежелательными ссылками, Google накажет вас или даже может удалить ваш сайт из базы данных. Ясно, что должен быть достигнут точный баланс. Этот баланс факторов на странице - столько же искусство, сколько наука.

Чем лучше страница оценивается по этим критериям, тем выше она попадает в результаты поиска. Страницы с наивысшим рейтингом появляются на первой странице поиска Google; Поскольку большинство пользователей Google никогда не выходят за пределы этой первой страницы, эти страницы с высоким рейтингом получают непропорциональный объем интернет-трафика.

Все это говорит о том, что, когда вы запускаете поиск в Google, он может реагировать так быстро, потому что в этот момент он не пытается выполнить поиск по всему Интернету; он консультируется со своей высокоорганизованной и приоритетной базой данных. Но даже более важно, чем создание молниеносных поисков, это означает, что у Google есть обширное хранилище данных о том, что находится в Интернете, и, что более важно, кто что использует, когда и для какой цели.

Что знает Google?

Google "знает" много, на самом деле. Google отслеживает результаты поиска и даже сохраняет файл по вашим запросам на основе вашего IP-адреса или логина Google. Это дает им небольшое окно в ваш разум, раскрывая то, что вас интересует, беспокоит, волнует и пугает. Это само по себе является мощной маркетинговой информацией.

Если бы вы могли воспользоваться этой базой данных, вы могли бы создать подробные профили о людях - их интересах, покупательских привычках, проблемах со здоровьем, семейных проблемах и многом другом. Вы можете обнаружить признаки того, что компания преуспевает или терпит неудачу, рассматривает ли она вопрос о слиянии или приобретении, и в какие линейки продуктов она может расширяться. Вы можете отслеживать исторические тенденции на выборах, в экономике, здравоохранении и в других областях, которые имеют значительную социальную, финансовую и политическую ценность.

Более того, если вы сознательно или неосознанно пользуетесь другими службами Google, вы предоставляете еще больше информации. Они сканируют Gmail, получая ту же информацию из вашей переписки, что и ваши запросы, а также информацию о ваших друзьях и соавторах. Если вы делитесь документами через документы Google, они знают, с кем вы работаете и над какими проектами. Google Checkout добавляет данные о ваших схемах покупок, ваших привычках расходов и вашем бюджете.

Также есть информация, которую вы передаете в Google, даже не подозревая об этом. Google собирает, как и другие интернет-службы, ваш IP-адрес и, возможно, ваш MAC-адрес. Ваш IP-адрес говорит им, где вы находитесь в мире, географически, а ваш MAC-адрес является уникальной подписью вашей машины; это позволяет им отслеживать, всегда ли вы используете одну и ту же машину, сколько машин вы используете и так далее. Таким образом, Google не только знает, что вы ищете и с кем общаетесь, компания также знает, где вы находитесь и какую машину или машины вы используете.

Конечно, давайте сделаем шаг назад и признаем, что практически любой интернет-сайт имеет доступ к некоторой или всей этой информации. Например, IP-адреса регулярно собираются для защиты от хакеров и атак типа «отказ в обслуживании». Информация о том, куда вы заходите на чей-то сайт, когда вы приходите и уходите, а также откуда и куда вы заходите, - это стандартная веб-статистика, доступная даже для самого маленького личного сайта.

Что отличает Google, так это его огромный размер и разнообразие услуг, что позволяет ему собирать больше разнообразной информации от большего количества людей.

Когда ваш тайник информации переходит от сотен кусочков данных к миллиардам, вы понимаете, что никто другой этого не делает. Что делает Google по-настоящему мощным, так это то, что он может наблюдать за людьми в более широком контексте, чем кто-либо другой. Google следит за вами, даже если вы не на своем компьютере. Карты Google предоставляют изображения с высоким разрешением для большей части Соединенных Штатов, а также некоторых других регионов мира. Вполне вероятно, что ваш дом будет виден на Картах Google, и, если вам случалось поливать двор, когда спутник пролетел мимо, вы также можете увидеть себя в самой короткой шортике!

Что может сделать Google

Есть несколько довольно очевидных применений для базы данных Google, AdWords, пожалуй, является самым популярным и заметным на данный момент.

Каждый раз, когда вы запускаете поиск в Google, первые несколько списков в верхней части страницы и списки справа являются «рекламными ссылками», платными рекламными объявлениями, которые покупают люди, которые считают, что пользователи, выполняющие поиск, похожи на ваши. были бы заинтересованы в их товарах и услугах. Этот метод распространился на другие веб-страницы, что объясняет прозвище «Реклама от Google», которое вы видите, когда показывало релевантную рекламу для страниц других веб-сайтов.

Очевидно, что продажа этого рекламного места является отличным источником дохода для Google. В 2007 году AdWords принес Google более 16 миллиардов долларов дохода, что сделало его крупнейшим источником дохода Google на сегодняшний день. Для сравнения, хранилище данных Google - это золотой рудник, который почти не использовался.

Пока что функции Google, которые мы видели, были в основном направлены на реагирование на текущие рыночные тенденции. Люди интересуются чем-то - новой версией X-Box, поиском электрика в Интернете, памятными вещами о Суперкубке и т. Д. - и Google помогает людям общаться со своими потенциальными клиентами.

Однако, имея достаточно информации, такая компания, как Google, может сделать нечто большее, чем просто с молниеносной скоростью реагировать на настоящее. Он также может видеть будущее или даже создавать будущее. Прежде чем вы думаете, что это просто параноидальная фантастическая мечта, подумайте над этой проблемой.

Давайте возьмем простой случай. Предположим, вы настроили программу, чтобы отмечать поиски, которые не приводят к поиску высоко ранжированных страниц - неудачные поиски, которые не предоставляют действительно полезную информацию для поисковика. Программа, которая отслеживает эти сбои, отмечает, что хотел поисковик, и помещает эти неудачные поиски в категории.

Просматривая эти сведения, что делать, если Google замечает, что существует большое количество неудачных поисков, которые все связаны с поиском самостоятельного супермаркета в Thermopolis, WY. Еще немного, и у меня есть список мест, где много неудачных поисков в супермаркетах DIY. Этот список был бы невероятно ценен для компании, которая франчайзирует магазины DIY (не называя никаких имен, но подумайте о тех больших оранжевых складах в каждом пригороде: разве они не хотели бы знать?).

Они не только знали бы, что там нет магазина DIY, но что определенное количество людей искало такой магазин. И они, вероятно, имели бы некоторое представление о том, что они надеялись купить там: бытовые приборы, строительные материалы, газовые грили и т. Д. Это безболезненное исследование рынка, аккуратно отсортированное и проанализированное Google.

Таким же образом эта информация может быть использована для идентификации потенциальных покупателей для конкретного продукта, отслеживать преступников, занимающихся детской порнографии, и поймать потенциальных воров Обсадные дом или магазин. Это может помочь разработчикам выбрать сайты для новых домов и магазинов, предупредить вас о суровой погоде в вашем районе, найти зарегистрированных избирателей и узнать об их привычках и интересах, а также помочь IRS найти людей, которые обманывают свои налоги. Также могут быть ошибки интерпретации: куча поисков рака в маленьком городе может означать много больных раком, но это также может означать, что там есть медицинская школа.

Как вы можете видеть, мы можем приветствовать некоторые виды использования этой информации и осуждать других. Но все они возможны, и все используют одни и те же базовые методы. Вы можете найти почти все, что вы хотите, вы просто должны знать, как искать это.

В моей следующей статье мы рассмотрим, что все это значит для вас как личности … и предпринимателя. Перейти к: Google Data Mine и ваш бизнес.

* * * * *

Об авторе: Гамлет Батиста - президент NEMedia S.A, поставщика программного обеспечения для автоматизации SEO, которое помогает предпринимателям и малым предприятиям повысить качество их естественного поискового трафика, сосредотачиваясь на том, что они делают лучше всего. Блог Hamlet, Hamlet Batista dot Com, посвящен самым передовым исследованиям в области SEO, а также стратегиям и тактикам, которые могут дать вам важное преимущество перед конкурентами.

17 комментариев ▼