КулЛиб - Классная библиотека! Скачать книги бесплатно
Всего книг - 716641 томов
Объем библиотеки - 1426 Гб.
Всего авторов - 275494
Пользователей - 125281

Последние комментарии

Новое на форуме

Новое в блогах

Впечатления

yan.litt про серию За последним порогом

В целом средненько, я бы даже сказал скучная жвачка. ГГ отпрыск изгнанной мамки-целицельницы, у которого осталось куча влиятельных дедушек бабушек из великих семей. И вот он там и крутится вертится - зарабатывает себе репу среди дворянства. Особого негатива к нему нет. Сюжет логичен, мир проработан, герои выглядят живыми. Но тем не менее скучненько как то. Из 10 я бы поставил 5 баллов и рекомендовал почитать что то более энергичное.

Рейтинг: 0 ( 0 за, 0 против).
Lena Stol про Небокрад: Костоправ. Книга 1 (Героическая фантастика)

Интересно, сюжет оригинален, хотя и здесь присутствует такой шаблон как академия, но без навязчивых, пустых диалогов. Книга понравилась.

Рейтинг: 0 ( 1 за, 1 против).
Lena Stol про Батаев: Проклятьем заклейменный (Героическая фантастика)

Бросила читать практически в самом начале - неинтересно.

Рейтинг: 0 ( 1 за, 1 против).
Lena Stol про Чернов: Стиратель (Попаданцы)

Хорошее фэнтези, прочитала быстро и с интересом.

Рейтинг: 0 ( 1 за, 1 против).
Влад и мир про серию История Московских Кланов

Прочитал первую книгу и часть второй. Скукота, для меня ничего интересно. 90% текста - разбор интриг, написанных по детски. ГГ практически ничему не учится и непонятно, что хочет, так как вовсе не человек, а высший демон, всё что надо достаёт по "щучьему велению". Я лично вообще не понимаю, зачем высшему демону нужны люди и зачем им открывать свои тайны. Живётся ему лучше в нечеловеческом мире. С этой точки зрения весь сюжет - туповат от

  подробнее ...

Рейтинг: 0 ( 0 за, 0 против).

Параллельные вычисления общего назначения на графических процессорах [Кирилл Александрович Некрасов] (pdf) читать постранично, страница - 2

Книга в формате pdf! Изображения и текст могут не отображаться!


 [Настройки текста]  [Cбросить фильтры]

сфор‑
мировать изображение этой сцены на плоскости экрана, положение
которой определяется точкой зрения наблюдателя.
Процесс формирования изображения включает в себя следующие
основные этапы:
· проектирование треугольников, представляющих сцену, на пло‑
скость экрана;
· разбиение полученных проекций на отдельные пиксели, для ко‑
торых будут определяться цвета (стадия растеризации треуголь‑
ников);
4

1.2. Архитектура графического процессора (GPU)

· определение видимого цвета элементов поверхности треуголь‑
ников с учетом исходного цвета и отражающих свойств самой
поверхности, прозрачности других поверхностей, освещенно‑
сти и теней.
Обрабатываемые сцены обычно состоят из очень многих треуголь‑
ников, которые разбиваются на еще большее количество пикселей, так
что их визуализация требует больших вычислительных ресурсов. Вме‑
сте с тем и вершины, и пиксели можно обрабатывать почти или со‑
всем независимо друг от друга. Соответственно задача визуализации
допускает очень эффективное распараллеливание.
Именно в целях распараллеливания графических вычислений цен‑
тральные процессоры персональных компьютеров стали с у п е р с к а л я р н ы ми — получили возможность одновременного (в екторного)
исполнения некоторых операций сразу над несколькими числами (рас‑
ширения 3DNow! и SSE).
Большинство центральных процессоров ПК состоит из несколь‑
ких ядер, что дополнительно увеличивает их потенциал как систем
для параллельных вычислений. Тем не менее исторически сложилось
так, что наиболее эффективными устройствами для распараллелива‑
ния вычислений на ПК стали и до сих пор остаются специализиро‑
ванные графические процессоры (GPU). Эти процессоры, разраба‑
тывавшиеся именно для обработки графики, практически полностью
ориентированы на параллельную обработку данных.

1.2. Архитектура графического процессора (GPU)
1.2.1. Распараллеливание вычислений по данным
Конструктивно графический процессор представляет собой вычис‑
лительное устройство, работающее отдельно от центрального процес‑
сора, параллельно с ним. Обычно графические процессоры размещают
на отдельных печатных платах с собственной системой охлаждения,
которые называют графическими ускорителями (или видеокартами).
Вместе с GPU на плате графического ускорителя расположена видео­
память — специализированная оперативная память, в которой хра‑
нятся обрабатываемые графическим процессором массивы данных.
5

1. Структура и возможности вычислительной системы с графическим процессором

На рис. 1.1 в качестве примера показана архитектура графическо‑
го процессора G80 — одного из процессоров компании NVIDIA [4].
Главной (и общей для всех графических процессоров) характеристи‑
кой этой архитектуры является то, что GPU представляет собой си‑
стему из параллельных вычислительных устройств, каждое из которых
применяет заданную, единую для всех устройств, программу (в ычисл и т е ль н о е я д р о , англ. kernel) к различным элементам входных мас‑
сивов данных, расположенных в общей памяти.
Отдельный «вычислитель» (процессор),
осуществляющий конвейерную обработку
данных

Центральный процессор (Host)
Устройство управления вычислительными процессами
(Tread Execution Manager)

SM

Параллельный кеш данных (Parallel Data
Cache, Shared Memory) – разделяемая память, одновременно доступная всем «вычислителям» одного мультипроцессора

16 мультипроцессоров
SM

SM

SM

SM

ј

SM

SM

SM

SM

Кеш графического процессора, доступный всем мультипроцессорам.
Центральному процессору доступен частично и только для записи
Общая память для размещения входных данных и результатов
(видеопамять, Global Memory), доступная как всем мультипроцессорам
GPU, так и центральному процессору. Размер − до нескольких гигабайтов
Рис. 1.1. Архитектура графического процессора NVIDIA G80 [4]

Параллельная архитектура графических процессоров ориентиро‑
вана на исполнение алгоритмов, в которых элементы больших вход‑
ных массивов обрабатываются одинаковым образом независимо или
почти независимо друг от друга, то есть использующих распарал л еливание вычислений по данным. Множества элементов, подверга‑
емых однотипной независимой обработке, называют потоками (дан‑
ных либо результатов), так что графические процессоры осуществляют
поточно-параллельную обработку данных.
6

1.2. Архитектура графического процессора (GPU)

Концепция программирования, заключающаяся в потоко‑
вой обработке данных, известна под аббревиатурой SIMD (от англ.
Single Instruction — Multiple Data — одна инструкция для множества
данных, рис. 1.2). Процессор, работающий по принципу SIMD, пре‑
образует поток данных в поток результатов, используя программу как
функцию преобразования.
Инструкции
(вычислительное ядро)

GPU
Данные

Результаты

Рис. 1.2. Поточно-параллельная