Недавно встал вопрос об оптимизации загрузки одного из моих сайтов. Помимо стандартных действий по увеличению производительности в Drupal: минимизации кода CSS и JavaScript, установки необходимых настроек на странице "Производительность", я решил уменьшить размер отдаваемых браузеру файлов и страниц сайта с помощью их сжатия.
После посещения множества сайтов и чтения кучи статей и комментариев я выяснил, что сжатие можно проводить двумя способами: с помощью средств сервера Apache или средствами PHP. Просмотрев настройки сервера на оптимизируемом сайте, оказалось, что на сервере не установлен модуль mod_gzip и mod_deflate, а значит использовать первый способ с Apache не приходится.
Пришлось снова лезть в Google и искать ответы на вопрос сжатия с помощью PHP. Все приведенные примеры сжатия были либо не применимы для Drupal, либо просто ужасны в реализации. В конце концов было сформировано решения на базе одного из методов.
Решения проблемы сжатия JS и CSS с помощью GZIP
Для того, чтобы включить сжатие JS и CSS файлов в Drupal, необходимо изменить два файла: .htaccess и index.php.
Изменения в .htaccess
В .htaccess нужно изменить стандартный для Drupal раздел переадресации на скрипт index.php. Вместо обычных двух строчек:
RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_URI} !=/favicon.ico
RewriteRule ^(.*)$ index.php?q=$1 [L,QSA]
нужно вставить следующий код:
RewriteCond %{REQUEST_FILENAME} !-f [OR]
RewriteCond %{REQUEST_FILENAME} ^.*\.(js|css)(\?.*)?$
RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_URI} !=/favicon.ico
RewriteRule ^(.*)$ index.php?q=$1 [L,QSA]
Вообще весь код выполняет некоторую проверку запрашиваемого браузером адреса и при ее успешном прохождении производит переадресацию на файл index.php.
Теперь я объясню второй блок кода. В первой строке проверяется является ли запрашиваемый адрес файлом. Если адрес является существующим на сервере файлом, то в целом все условие становится ложным и переадресации на index.php не происходит.
По умолчанию следующие друг за другом условия RewriteCond соединяются логическим AND. В нашем случае нам необходимо использовать логическое OR, чтобы файлы js и css прошли по условию во второй строке. Для этого я поставил флаг [OR] в конце первой строки. Такой флаг объединяет логическим ИЛИ текущую и следующую строку. В третьей строке отсеиваются директории сервера.
Зачем нужна четвертая строка, если уже есть первая я так и не понял. Буду признателен, если кто-то объяснит это в комментарии к статье.
Пятая строка производит перенаправление на файл index.php при выполнении предшествующих ей условий. При этом вся часть адреса после имени домена передается в параметр q.
Изменения в index.php
После обработки сервером директив в файле .htaccess управление передается файлу index.php. В нем и будет происходить сжатие файлов и страниц сайта. Для осуществления этой жизненно необходимой процедуры нужно добавить в файл index.php перед всеми остальными выполняемыми строчками следующий блок кода:
<?
if (substr_count($_SERVER['HTTP_ACCEPT_ENCODING'], 'gzip'))
// проверяется, поддерживает ли браузер сжатие gzip или x-gzip
{
if (!is_file($_GET["q"]))
// проверяется, является ли адрес похожим на файл
{
ob_start("ob_gzhandler"); // запускается обработка gzip для сжатия html-кода страниц сайта
header ("Content-Type: text/html; charset: UTF-8");
header ("Cache-Control: must-revalidate");
header ("Expires: " . gmdate ("D, d M Y H:i:s", time() + 60 * 60) . " GMT");
}
else if (preg_match("/^.*\.(js|css)(&\w+)?$/", $_SERVER["QUERY_STRING"], $ext))
// проверяется, является ли адрес похожим на файлы js или css
{
// часть следующего куска кода позаимствована из функции drupal_page_cache_header(), и необходима для кэширования сжатых файлов браузером.
$last_modified = gmdate('D, d M Y H:i:s', filectime($_GET["q"])) .' GMT';
$etag = '"'. md5($last_modified) .'"';
$if_modified_since = isset($_SERVER['HTTP_IF_MODIFIED_SINCE']) ? stripslashes($_SERVER['HTTP_IF_MODIFIED_SINCE']) : FALSE;
$if_none_match = isset($_SERVER['HTTP_IF_NONE_MATCH']) ? stripslashes($_SERVER['HTTP_IF_NONE_MATCH']) : FALSE;
if ($if_modified_since && $if_none_match && $if_none_match == $etag && $if_modified_since == $last_modified)
{
header('HTTP/1.1 304 Not Modified');
header("Expires: Sun, 19 Nov 1978 05:00:00 GMT");
header("Etag: $etag");
}
else
{
ob_start("ob_gzhandler");
$myme = array(
"css" => "text/css",
"js" => "text/javascript",
);
header ("Content-Type: ".(($myme[$ext[1]])?$myme[$ext[1]]:"text/html")."; charset: UTF-8");
header("Last-Modified: $last_modified");
header("ETag: $etag");
header("Expires: Sun, 19 Nov 1978 05:00:00 GMT");
header("Cache-Control: must-revalidate");
print file_get_contents($_GET["q"]);
}
exit;
}
}
?>
Этот кусок кода я вставил перед строкой:
<? require_once './includes/bootstrap.inc'; ?>
Если включено сжатие страниц на странице "Производительность" в настройках Drupal, то сжимать страницы самостоятельно не имеет смысла. И поэтому нужно оставить только код для сжатия JS и CSS файлов. Однако я все-таки предпочитаю отключать сжатие страниц Друпалом (так как оно как-то странно работает) и сжимаю их с помощью своего скрипта.
<?
if (substr_count($_SERVER['HTTP_ACCEPT_ENCODING'], 'gzip'))
// проверяется, поддерживает ли браузер сжатие gzip или x-gzip
{
if (preg_match("/^.*\.(js|css)(&\w+)?$/", $_SERVER["QUERY_STRING"], $ext) && is_file($_GET["q"]))
// проверяется, является ли адрес похожим на файлы js или css
{
// часть следующего куска кода позаимствована из функции drupal_page_cache_header(), и необходима для кэширования сжатых файлов браузером.
$last_modified = gmdate('D, d M Y H:i:s', filectime($_GET["q"])) .' GMT';
$etag = '"'. md5($last_modified) .'"';
$if_modified_since = isset($_SERVER['HTTP_IF_MODIFIED_SINCE']) ? stripslashes($_SERVER['HTTP_IF_MODIFIED_SINCE']) : FALSE;
$if_none_match = isset($_SERVER['HTTP_IF_NONE_MATCH']) ? stripslashes($_SERVER['HTTP_IF_NONE_MATCH']) : FALSE;
if ($if_modified_since && $if_none_match && $if_none_match == $etag && $if_modified_since == $last_modified)
{
header('HTTP/1.1 304 Not Modified');
header("Expires: Sun, 19 Nov 1978 05:00:00 GMT");
header("Etag: $etag");
}
else
{
ob_start("ob_gzhandler");
$myme = array(
"css" => "text/css",
"js" => "text/javascript",
);
header ("Content-Type: ".(($myme[$ext[1]])?$myme[$ext[1]]:"text/html")."; charset: UTF-8");
header("Last-Modified: $last_modified");
header("ETag: $etag");
header("Expires: Sun, 19 Nov 1978 05:00:00 GMT");
header("Cache-Control: must-revalidate");
print file_get_contents($_GET["q"]);
}
exit;
}
}
?>
Чего же я добился?
Благодаря этим усовершенствованиям я добился сжатия большей части передаваемых с сайта данных. Применять этот механизм к медиа-файлам типа картинок или видео не только бесполезно, но и опасно для производительности сервера.

Кроме того я смог включить кэширование сжатых данных браузером. В конце концов все эти действия позволили сжать HTML-код, JS и CSS файлы совокупно в три раза, а вес главной страницы уменьшить вдвое.
Например, эта страница (где находится эта статья) была оптимизирована следующим образом:
| Без сжатия | Со сжатием GZIP | Уменьшение размера файлов | |
|---|---|---|---|
| HTML | 37 КБ | 10 КБ | 370% |
| CSS | 90 КБ | 22 КБ | 400% |
| JavaScript | 465 КБ | 150 КБ | 310% |
| Страница целиком (с картинками) | 654 КБ | 244 КБ | 268% |
P.S. Тестирование передачи данных между сервером и браузером проводилось с помощью расширений Web Developer и Firebug для браузера Mozilla Firefox.

Комментарии
Отличная статья и результаты впечатляющие!
Есть пару вопросов.
1) Как к данному методу (сжатие всего что только можно) относятся Яндек и Гугл ??
2) Как данный метод работает в связке с модулями cacherouter и boost??
Пара ответов: )
1) Этим методом можно сжать только файлы на своем сервере
2) Понятия не имею )
"error": "Service Unavailable"
Искреннее и огромное спасибо! Google Page Speed 100 из 100 )
Большое спасибо автору, очень полезная информация