Python
Компьютерная литература
  • формат djvu
  • размер 2,79 МБ
  • добавлен 1 апреля 2015 г.
Сегаран Тоби. Программируем коллективный разум
СПб.: Символ-Плюс, 2008. — 368 с.
Средства эффективной обработки информации в Интернете еще никогда не были настолько важны и востребованы, как сегодня. Эта книга — первое практическое руководство по программированию интеллектуальных приложений для Web2.0.
Здесь вы найдете все необходимое, чтобы научиться создавать самообучаемые программы на языке Python, которые способны собирать и анализировать огромные массивы данных, имеющиеся в Сети. Вы научитесь пользоваться алгоритмами машинного обучения, адаптируя их под свои собственные нужды. Чтобы овладеть представленным материалом, от вас не потребуется никаких специальных знаний об анализе данных, машинном обучении или математической статистике. Однако предполагается, что вы имеете достаточный опыт программирования и знакомы с основными концепциями. В каждой главе вы найдете практические примеры и задания, которые помогут вам быстро и легко освоить различные аспекты работы алгоритмов.
Оглавление
Предисловие
Введение
Благодарности
Введение в коллективный разум
Что такое коллективный разум
Что такое машинное обучение
Ограничения машинного обучения
Примеры из реальной жизни
Другие применения обучающих алгоритмов
Выработка рекомендаций
Коллаборативная фильтрация
Сбор информации о предпочтениях
Отыскание похожих пользователей
Рекомендование предметов
Подбор предметов
Построение рекомендателя ссылок с помощью API сайта del.icio.us
Фильтрация по схожести образцов
Использование набора данных MovieLens
Сравнение методов фильтрации по схожести пользователей
и по схожести образцов
Упражнения
Обнаружение групп
Обучение с учителем и без него
Векторы слов
Иерархическая кластеризация
Рисование дендрограммы
Кластеризация столбцов
Кластеризация методом K-средних
Кластеры предпочтений
Просмотр данных на двумерной плоскости
Что еще можно подвергнуть кластеризации
Упражнения
Поиск и ранжирование
Что такое поисковая машина
Простой паук
Построение индекса
Запросы
Ранжирование по содержимому
Использование внешних ссылок на сайт
Обучение на основе действий пользователя
Упражнения
Оптимизация
Групповые путешествия
Представление решений
Целевая функция
Случайный поиск
Алгоритм спуска с горы
Алгоритм имитации отжига
Генетические алгоритмы
Поиск реальных авиарейсов
Оптимизация с учетом предпочтений
Визуализация сети
Другие возможности
Упражнения
Фильтрация документов
Фильтрация спама
Документы и слова
Обучение классификатора
Вычисление вероятностей
Наивная классификация
Метод Фишера
Сохранение обученных классификаторов
Фильтрация блогов
Усовершенствование алгоритма обнаружения признаков
Использование службы Akismet
Альтернативные методы
Упражнения
Моделирование с помощью деревьев решений
Прогнозирование количества регистраций
Введение в теорию деревьев решений
Обучение дерева
Выбор наилучшего разбиения
Рекурсивное построение дерева
Отображение дерева
Классификация новых наблюдений
Отсечение ветвей дерева
Восполнение отсутствующих данных
Числовые результаты
Моделирование цен на недвижимость
Моделирование степени привлекательности
В каких случаях применять деревья решений
Упражнения
Построение ценовых моделей
Построение демонстрационного набора данных
Алгоритм k-ближайших соседей
Взвешенные соседи
Перекрестный контроль
Гетерогенные переменные
Оптимизация масштаба
Неравномерные распределения
Использование реальных данных – API сайта eBay
В каких случаях применять метод k-ближайших соседей
Упражнения
Более сложные способы классификации: ядерные методы и машины опорных векторов
Набор данных для подбора пар
Затруднения при анализе данных
Простая линейная классификация
Категориальные свойства
Масштабирование данных
Идея ядерных методов
Метод опорных векторов
Библиотека LIBSVM
Подбор пар на сайте Facebook
Упражнения
Выделение независимых признаков
Массив новостей
Прошлые подходы
Неотрицательная матричная факторизация
Вывод результатов
Использование данных о фондовом рынке
Упражнения
Эволюционирующий разум
Что такое генетическое программирование
Программы как деревья
Создание начальной популяции
Проверка решения
Мутация программ
Скрещивание
Построение окружающей среды
Простая игра
Направления развития
Упражнения
Сводка алгоритмов
Байесовский классификатор
Классификатор на базе деревьев решений
Нейронные сети
Метод опорных векторов
k-ближайшие соседи
Кластеризация
Многомерное шкалирование
Неотрицательная матричная факторизация
Оптимизация
Приложения
А. Дополнительные библиотеки
В. Математические формулы
Алфавитный указатель
Возможность скачивания данного файла заблокирована по требованию правообладателя.