Структура CGl-программы.

CGI (от англ. Common Gateway Interface — «общий интерфейс шлюза») — стандарт интерфейса, используемого для связи внешней программы с веб-сервером. Программу, которая работает по такому интерфейсу совместно с веб-сервером, принято называть шлюзом, хотя многие предпочитают названия «скрипт» (сценарий) или «CGI-программа».

Сам интерфейс разработан таким образом, чтобы можно было использовать любой язык программирования, который может работать со стандартными устройствами ввода-вывода. Такими возможностями обладают даже скрипты для встроенных командных интерпретаторов операционных систем, поэтому в простых случаях могут использоваться даже командные скрипты.

Все скрипты, как правило, помещают в каталог cgi (или cgi-bin) сервера, но это необязательно: скрипт может располагаться где угодно, но при этом большинство веб-серверов требуют специальной настройки. В веб-сервере Apache, например, такая настройка может производиться при помощи общего файла настроек httpd.conf или с помощью файла .htaccess в том каталоге, где содержится этот скрипт.

CGI является одним из наиболее распространённых средств создания динамических веб-страниц.

Как и любая программа, программа CGI шлюза должна получить данные, обработать их и вывести результат работы в наглядной форме.

Весь процесс получения данных от веб-сервера можно представить следуюшим образом:

1. Получить все необходимые переменные окружения. Наиболее важной на данном этапе является REQUEST_METHOD.

2. Получить данные от сервера в зависимости от метода передачи:

3. Если (REQUEST_METHOD="GET") то

4. Взять данные из переменной окружения QUERY_STRING

5. Иначе

6. Если (REQUEST_METHOD="POST") то

7. Проанализировать переменную QUERY_STRING

8. Получить длинну данных из CONTENT_LENGTH

9. Если (CONTENT_LENGTH>0) то

10. Считать CONTENT_LENGTH байт из sdtin как данные.

11. Иначе

12. Выдать сообщение об ошибке и выйти.

13. Декодировать все полученные данные и, если надо, разбить их на пары "имя=значение" в удобную для программы форму.

С анализом переменной REQUEST_METHOD думаю все ясно, а вот ,что значит в методе POST проанализировать QUERY_STRING, наверно, не все ясно. При передаче методом POSTсервер посылает данные через стандартный поток ввода, но это не значит, что пользователь не пользовался URL'ом для передачи данных. Примером может служить многопользовательский шлюз, в котором для идентификации пользователя используется URL, а для передачи данных stdin:

http://.../cgi-bin/guestbook.cgi?user=bob&rec=0

В этом случае шлюзу гостевой книги (guestbook.cgi) сообщается два параметра user и rec, с помощью которых она может узнать "куда записывать" или "как обрабатывать" данные поступающие через поток ввода.

Считывание данных через поток sdtin должно осуществляться в динамическую память, или же во временный файл, если размер памяти ограничен или данные слишком велики для полного размещения в ОЗУ. С чем это связано ? Это связано с тем, что при использовании статичестких буферов может произойти его переполнение.

Пример:

char cgi_data[1000];

...

long content_length=atol(getenv("CONTENT_LENGTH"));

fread(cgi_data,content_length,1,stdin);

...

Надеюсь все сразу видно :-)). Если content_length>1000, то произойдет переполнение cgi_data. Переполнение буферов это излюбленный метод атаки хакеров. Вместо этого лучше выделять память динамически:

char *cgi_data;

...

long content_length=atol(getenv("CONTENT_LENGTH"));

cgi_data=(char *)malloc(content_length);

if (cgi_data!=NULL)

fread(cgi_data,content_length,1,stdin);

...

После получения данных от сервера их надо еще декодировать. Можно это сделать сразу, а можно по мере надобности. Если Вы будете это делать сразу, то Вам также придется их разбить на куски, так как при декодировании могут появиться лишние знаки "&" и "=", которые больше не позволят вам отделять пары "имя=значение" друг от друга.

Вот пример процедуры, которая декодирует данные из буфера:

/* Возвращает верхний регистр символа*/

char upperchar(char ch)

{

if ((ch>='a') && (ch<='z'))

{

ch='A'+(ch - 'a');

return ch;

}

else return ch;

};

/* Переводит из Hex в Dec*/

char gethex(char ch)

{

ch=upperchar(ch);

if ((ch>='0')&&(ch<= '9')) return (ch-'0');

if ((ch>='A')&&( ch<='F')) return (ch-'A'+10);

};

Ищет и возвращает параметр с именем name, в buffer.

Если параметр name не найден, возвращает NULL.

Пример : message = getparam(post_buffer,"message=");

Замечание : символ "=" после имени параметра не удаляется

и входит в возвращаемый результат, поэтому рекомендуется

искать параметр вместе с символом "=".

char *getparam(char *buffer,char *name)

{

if (buffer==NULL) return NULL;

char *pos;

long leng=512,i=0,j=0;

char h1,h2,Hex;

char *p=(char *)malloc(leng);

pos=strstr(buffer,name);

if (pos == NULL) return NULL;

if ((pos!=buffer) && (*(pos-1)!='&')) return NULL;

pos+=strlen(name);

while ( (*(pos+i)!='&')&&( *(pos+i)!='\0' ))

{

if ( *(pos+i)=='%' )

{

i++;

h1=gethex(*(pos+i));

i++;

h2=gethex(*(pos+i));

h1=h1<<4;

*(p+j)=h1+h2;

}

else

{

if (*(pos+i)!='+') *(p+j)=*(pos+i);

else *(p+j)=' ';

};

i++;

j++;

if (j >= leng) p=(char*)realloc(p,leng+20);

leng+=20;

};

if (j < leng) p=(char*)realloc(p,j+1);

*(p+j)='\0';

return p;

};

Технология CGI позволяет просто поменять содержимое веб-сервера. Простым примером может служить скрипт, который при каждом новом обновлении страницы вставляет в нее новую ссылку(банер) или анекдот. Более сложными скриптами являются гостевые книги, чаты, форумы и естественно поисковые сервераили базы данных построенные на технологиях интернета.

<18 192021 22 23 24 >

Дата добавления: 2016-04-23; просмотров: 1152;