Оптимизация производительности в Drupal: сжатие страниц, файлов CSS и JavaScript с помощью GZIP

Версия для печатиВерсия для печати

Недавно встал вопрос об оптимизации загрузки одного из моих сайтов. Помимо стандартных действий по увеличению производительности в Drupal: минимизации кода CSS и JavaScript, установки необходимых настроек на странице "Производительность", я решил уменьшить размер отдаваемых браузеру файлов и страниц сайта с помощью их сжатия.

После посещения множества сайтов и чтения кучи статей и комментариев я выяснил, что сжатие можно проводить двумя способами: с помощью средств сервера Apache или средствами PHP. Просмотрев настройки сервера на оптимизируемом сайте, оказалось, что на сервере не установлен модуль mod_gzip и mod_deflate, а значит использовать первый способ с Apache не приходится.

Пришлось снова лезть в Google и искать ответы на вопрос сжатия с помощью PHP. Все приведенные примеры сжатия были либо не применимы для Drupal, либо просто ужасны в реализации. В конце концов было сформировано решения на базе одного из методов.

Решения проблемы сжатия JS и CSS с помощью GZIP

Для того, чтобы включить сжатие JS и CSS файлов в Drupal, необходимо изменить два файла: .htaccess и index.php.

Изменения в .htaccess

В .htaccess нужно изменить стандартный для Drupal раздел переадресации на скрипт index.php. Вместо обычных двух строчек:

RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_URI} !=/favicon.ico
RewriteRule ^(.*)$ index.php?q=$1 [L,QSA]

нужно вставить следующий код:

RewriteCond %{REQUEST_FILENAME} !-f [OR]
RewriteCond %{REQUEST_FILENAME} ^.*\.(js|css)(\?.*)?$
RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_URI} !=/favicon.ico
RewriteRule ^(.*)$ index.php?q=$1 [L,QSA]

Вообще весь код выполняет некоторую проверку запрашиваемого браузером адреса и при ее успешном прохождении производит переадресацию на файл index.php.

Теперь я объясню второй блок кода. В первой строке проверяется является ли запрашиваемый адрес файлом. Если адрес является существующим на сервере файлом, то в целом все условие становится ложным и переадресации на index.php не происходит.

По умолчанию следующие друг за другом условия RewriteCond соединяются логическим AND. В нашем случае нам необходимо использовать логическое OR, чтобы файлы js и css прошли по условию во второй строке. Для этого я поставил флаг [OR] в конце первой строки. Такой флаг объединяет логическим ИЛИ текущую и следующую строку. В третьей строке отсеиваются директории сервера.

Зачем нужна четвертая строка, если уже есть первая я так и не понял. Буду признателен, если кто-то объяснит это в комментарии к статье.

Пятая строка производит перенаправление на файл index.php при выполнении предшествующих ей условий. При этом вся часть адреса после имени домена передается в параметр q.

Изменения в index.php

После обработки сервером директив в файле .htaccess управление передается файлу index.php. В нем и будет происходить сжатие файлов и страниц сайта. Для осуществления этой жизненно необходимой процедуры нужно добавить в файл index.php перед всеми остальными выполняемыми строчками следующий блок кода:

<?
if (substr_count($_SERVER['HTTP_ACCEPT_ENCODING'], 'gzip'))
// проверяется, поддерживает ли браузер сжатие gzip или x-gzip
{
  if (!is_file($_GET["q"]))
  // проверяется, является ли адрес похожим на файл
  {
    ob_start("ob_gzhandler"); // запускается обработка gzip для сжатия html-кода страниц сайта
    header ("Content-Type: text/html; charset: UTF-8");
    header ("Cache-Control: must-revalidate");
    header ("Expires: " . gmdate ("D, d M Y H:i:s", time() + 60 * 60) . " GMT");
  }
  else if (preg_match("/^.*\.(js|css)(&\w+)?$/", $_SERVER["QUERY_STRING"], $ext))
  // проверяется, является ли адрес похожим на файлы js или css
  {
    // часть следующего куска кода позаимствована из функции drupal_page_cache_header(), и необходима для кэширования сжатых файлов браузером.
    $last_modified = gmdate('D, d M Y H:i:s', filectime($_GET["q"])) .' GMT';
    $etag = '"'. md5($last_modified) .'"';
 
    $if_modified_since = isset($_SERVER['HTTP_IF_MODIFIED_SINCE']) ? stripslashes($_SERVER['HTTP_IF_MODIFIED_SINCE']) : FALSE;
    $if_none_match = isset($_SERVER['HTTP_IF_NONE_MATCH']) ? stripslashes($_SERVER['HTTP_IF_NONE_MATCH']) : FALSE;
   
    if ($if_modified_since && $if_none_match && $if_none_match == $etag && $if_modified_since == $last_modified)
    {
      header('HTTP/1.1 304 Not Modified');
      header("Expires: Sun, 19 Nov 1978 05:00:00 GMT");
      header("Etag: $etag");
    }
    else
    {   
      ob_start("ob_gzhandler");
      $myme = array(
        "css" => "text/css",
        "js" => "text/javascript",
      );
      header ("Content-Type: ".(($myme[$ext[1]])?$myme[$ext[1]]:"text/html")."; charset: UTF-8");
      header("Last-Modified: $last_modified");
      header("ETag: $etag");
      header("Expires: Sun, 19 Nov 1978 05:00:00 GMT");
      header("Cache-Control: must-revalidate");
      print file_get_contents($_GET["q"]);
    }
    exit;
  }
}
?>

Этот кусок кода я вставил перед строкой:

<?
require_once './includes/bootstrap.inc';
?>

Если включено сжатие страниц на странице "Производительность" в настройках Drupal, то сжимать страницы самостоятельно не имеет смысла. И поэтому нужно оставить только код для сжатия JS и CSS файлов. Однако я все-таки предпочитаю отключать сжатие страниц Друпалом (так как оно как-то странно работает) и сжимаю их с помощью своего скрипта.

<?
if (substr_count($_SERVER['HTTP_ACCEPT_ENCODING'], 'gzip'))
// проверяется, поддерживает ли браузер сжатие gzip или x-gzip
{
  if (preg_match("/^.*\.(js|css)(&\w+)?$/", $_SERVER["QUERY_STRING"], $ext) && is_file($_GET["q"]))
  // проверяется, является ли адрес похожим на файлы js или css
  {
    // часть следующего куска кода позаимствована из функции drupal_page_cache_header(), и необходима для кэширования сжатых файлов браузером.
    $last_modified = gmdate('D, d M Y H:i:s', filectime($_GET["q"])) .' GMT';
    $etag = '"'. md5($last_modified) .'"';
 
    $if_modified_since = isset($_SERVER['HTTP_IF_MODIFIED_SINCE']) ? stripslashes($_SERVER['HTTP_IF_MODIFIED_SINCE']) : FALSE;
    $if_none_match = isset($_SERVER['HTTP_IF_NONE_MATCH']) ? stripslashes($_SERVER['HTTP_IF_NONE_MATCH']) : FALSE;
   
    if ($if_modified_since && $if_none_match && $if_none_match == $etag && $if_modified_since == $last_modified)
    {
      header('HTTP/1.1 304 Not Modified');
      header("Expires: Sun, 19 Nov 1978 05:00:00 GMT");
      header("Etag: $etag");
    }
    else
    {   
      ob_start("ob_gzhandler");
      $myme = array(
        "css" => "text/css",
        "js" => "text/javascript",
      );
      header ("Content-Type: ".(($myme[$ext[1]])?$myme[$ext[1]]:"text/html")."; charset: UTF-8");
      header("Last-Modified: $last_modified");
      header("ETag: $etag");
      header("Expires: Sun, 19 Nov 1978 05:00:00 GMT");
      header("Cache-Control: must-revalidate");
      print file_get_contents($_GET["q"]);
    }
    exit;
  }
}
?>

Чего же я добился?

Благодаря этим усовершенствованиям я добился сжатия большей части передаваемых с сайта данных. Применять этот механизм к медиа-файлам типа картинок или видео не только бесполезно, но и опасно для производительности сервера.

Результаты после включения механизмов сжатия HTML, CSS и JavaScript

Кроме того я смог включить кэширование сжатых данных браузером. В конце концов все эти действия позволили сжать HTML-код, JS и CSS файлы совокупно в три раза, а вес главной страницы уменьшить вдвое.

Например, эта страница (где находится эта статья) была оптимизирована следующим образом:

  Без сжатия Со сжатием GZIP Уменьшение размера файлов
HTML 37 КБ 10 КБ 370%
CSS 90 КБ 22 КБ 400%
JavaScript 465 КБ 150 КБ 310%
Страница целиком (с картинками) 654 КБ 244 КБ 268%

P.S. Тестирование передачи данных между сервером и браузером проводилось с помощью расширений Web Developer и Firebug для браузера Mozilla Firefox.

Ваша оценка: Нет Средняя: 7.6 (13 голосов)

Комментарии

Отличная статья и результаты впечатляющие!

Есть пару вопросов.

1) Как к данному методу (сжатие всего что только можно) относятся Яндек и Гугл ??

2) Как данный метод работает в связке с модулями cacherouter и boost??

 

Пара ответов: )

1) Этим методом можно сжать только файлы на своем сервере

2) Понятия не имею )

"error": "Service Unavailable"

Искреннее и огромное спасибо! Google Page Speed 100 из 100 )

 Большое спасибо автору, очень полезная информация