WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 3 | 4 || 6 |

«А. Богатырёв, 1992-96 -1- Си в UNIX™ А. Богатырёв Язык Си в системе UNIX ...»

-- [ Страница 5 ] --

/* directory stream */ ino_t rino;

/* root inode number */ struct dirent *dir;

/* directory entry struct */ struct stat d, dd;

/* file status struct */ pathsize = 0;

*pnptr = '\0';

stat (ROOTDIR, &d);

rdev = d.st_dev;

rino = d.st_ino;

for (;

;

) { stat (CURDIR, &d);

if (d.st_ino == rino && d.st_dev == rdev) break;

/* reached root directory */ if ((dirp = opendir (PARENTDIR)) == NULL) { GETWDERR ("getwd: can't open..");

goto fail;

} if (chdir (PARENTDIR) < 0) { closedir (dirp);

GETWDERR ("getwd: can't chdir to..");

goto fail;

} А. Богатырёв, 1992-96 - 220 - Си в UNIX™ fstat (dirp -> dd_fd, &dd);

if (d.st_dev == dd.st_dev) { if (d.st_ino == dd.st_ino) { /* reached root directory */ closedir (dirp);

break;

} do { if ((dir = readdir (dirp)) == NULL) { closedir (dirp);

GETWDERR ("getwd: read error in..");

goto fail;

} } while (dir -> d_ino != d.st_ino);

} else do { if ((dir = readdir (dirp)) == NULL) { closedir (dirp);

GETWDERR ("getwd: read error in..");

goto fail;

} stat (dir -> d_name, &dd);

} while (dd.st_ino != d.st_ino || dd.st_dev != d.st_dev);

closedir (dirp);

pnptr = prepend (PATHSEP, prepend (dir -> d_name, pnptr));

} if (*pnptr == '\0') /* current dir == root dir */ strcpy (pathname, ROOTDIR);

else { strcpy (pathname, pnptr);

if (chdir (pnptr) < 0) { GETWDERR ("getwd: can't change back to.");

return (NULL);

} } return (pathname);

fail:

chdir (prepend (CURDIR, pnptr));

return (NULL);

} #endif А. Богатырёв, 1992-96 - 221 - Си в UNIX™ /* * prepend() tacks a directory name onto the front of a pathname.

*/ static char *prepend ( register char *dirname, /* что добавлять */ register char *pathname /* к чему добавлять */ ){ register int i;

/* длина имени каталога */ for (i = 0;

*dirname != '\0';

i++, dirname++) continue;

if ((pathsize += i) < MAXPATHLEN) while (i-- > 0) *--pathname = *--dirname;

return (pathname);

} #ifndef CWDONLY void main(){ char buffer[MAXPATHLEN+1];

char *cwd = getwd(buffer);

printf( "%s%s\n", cwd ? "": "ERROR:", buffer);

} #endif 6.10.2. Напишите функцию canon(), канонизирующую имя файла, т.е. превращающую его в полное имя (от корневого каталога), не содержащее компонент "." и "..", а также лишних символов слэш '/'. Пусть, к примеру, текущий рабочий каталог есть /usr/abs/C-book. Тогда функция преобразует. -> /usr/abs/C-book.. -> /usr/abs../.. -> /usr ////.. -> / /aa -> /aa /aa/../bb -> /bb cc//dd/../ee -> /usr/abs/C-book/cc/ee../a/b/./d -> /usr/abs/a/b/d Ответ:

#include /* слэш, разделитель компонент пути */ #define SLASH '/' extern char *strchr (char *, char), *strrchr(char *, char);

struct savech{ char *s, c;

};

#define SAVE(sv, str) (sv).s = (str);

(sv).c = *(str) #define RESTORE(sv) if((sv).s) *(sv).s = (sv).c /* Это структура для использования в таком контексте:

void main(){ char *d = "hello";

struct savech ss;

SAVE(ss, d+3);

*(d+3) = '\0';

printf("%s\n", d);

RESTORE(ss);

printf("%s\n", d);

} */ /* ОТСЕЧЬ ПОСЛЕДНЮЮ КОМПОНЕНТУ ПУТИ */ struct savech parentdir(char *path){ char *last = strrchr( path, SLASH );

char *first = strchr ( path, SLASH );

struct savech sp;

sp.s = NULL;

sp.c = '\0';

if( last == NULL ) return sp;

/* не полное имя */ if( last[1] == '\0' ) return sp;

/* корневой каталог */ if( last == first ) /* единственный слэш: /DIR */ last++;

sp.s = last;

sp.c = *last;

*last = '\0';

А. Богатырёв, 1992-96 - 222 - Си в UNIX™ return sp;

} #define isfullpath(s) (*s == SLASH) /* КАНОНИЗИРОВАТЬ ИМЯ ФАЙЛА */ void canon( char *where, /* куда поместить ответ */ char *cwd, /* полное имя текущего каталога */ char *path /* исходное имя для канонизации */ ){ char *s, *slash;

/* Сформировать имя каталога - точки отсчета */ if( isfullpath(path)){ s = strchr(path, SLASH);

/* @ */ strncpy(where, path, s - path + 1);

where[s - path + 1] = '\0';

/* или даже просто strcpy(where, "/");

*/ path = s+1;

/* остаток пути без '/' в начале */ } else strcpy(where, cwd);

/* Покомпонентный просмотр пути */ do{ if(slash = strchr(path, SLASH)) *slash = '\0';

/* теперь path содержит очередную компоненту пути */ if(*path == '\0' || !strcmp(path, ".")) ;

/* то просто проигнорировать "." и лишние "///" */ else if( !strcmp(path, "..")) (void) parentdir(where);

else{ int len = strlen(where);

/* добавить в конец разделяющий слэш */ if( where[len-1] != SLASH ){ where[len] = SLASH;

where[len+1] = '\0';

} strcat( where+len, path );

/* +len чисто для ускорения поиска * конца строки внутри strcat();

*/ } if(slash){ *slash = SLASH;

/* восстановить */ path = slash + 1;

} } while (slash != NULL);

} char cwd[256], input[256], output[256];

void main(){ /* Узнать полное имя текущего каталога.

* getcwd() - стандартная функция, вызывающая * через popen() команду pwd (и потому медленная).

*/ getcwd(cwd, sizeof cwd);

while( gets(input)){ canon(output, cwd, input);

printf("%-20s -> %s\n", input, output);

} } В этом примере (изначально писавшемся для MS DOS) есть "странное" место, помеченное /*@*/. Дело в том, что в DOS функция isfullpath была способна распознавать имена файлов вроде C:\aaa\bbb, которые не обязательно начинаются со слэша.

6.11. Мультиплексирование ввода-вывода.

Данная глава посвящена системному вызову select, который, однако, мы предоставляем вам иссле довать самостоятельно. Его роль такова: он позволяет опрашивать несколько дескрипторов открытых фай лов (или устройств) и как только в файле появляется новая информация - сообщать об этом нашей про грамме. Обычно это бывает связано с дескрипторами, ведущими к сетевым устройствам.

А. Богатырёв, 1992-96 - 223 - Си в UNIX™ 6.11.1.

/* Пример использования вызова select() для мультиплексирования * нескольких каналов ввода. Этот вызов можно также использовать * для получения таймаута.

* Вызов: войти на терминалах tty01 tty02 и набрать на каждом * sleep * затем на tty00 сказать select /dev/tty01 /dev/tty * и вводить что-либо на терминалах tty01 и tty * Сборка: cc select.c -o select -lsocket */ #include #include #include /* fd_set, FD_SET, e.t.c. */ #include /* NOFILE */ #include #include #include /* для FIONREAD */ #define max(a,b) ((a) > (b) ? (a) : (b)) char buf[512];

/* буфер чтения */ int fdin, fdout;

/* дескрипторы каналов stdin, stdout */ int nready;

/* число готовых каналов */ int nopen;

/* число открытых каналов */ int maxfd = 0;

/* максимальный дескриптор */ int nfds;

/* сколько первых дескрипторов проверять */ int f;

/* текущий дескриптор */ fd_set set, rset;

/* маски */ /* таблица открытых нами файлов */ struct _fds { int fd;

/* дескриптор */ char name[30];

/* имя файла */ } fds[ NOFILE ] = { /* NOFILE - макс. число открытых файлов на процесс */ { 0, "stdin" }, { 1, "stdout" }, { 2, "stderr" } /* все остальное - нули */ };

struct timeval timeout, rtimeout;

/* выдать имя файла по дескриптору */ char *N( int fd ){ register i;

for(i=0;

i < NOFILE;

i++) if(fds[i].fd == fd ) return fds[i].name;

return "???";

} А. Богатырёв, 1992-96 - 224 - Си в UNIX™ void main( int ac, char **av ){ nopen = 3;

/* stdin, stdout, stderr */ for( f = 3;

f < NOFILE;

f++ ) fds[f].fd = (-1);

fdin = fileno(stdin);

fdout = fileno(stdout);

setbuf(stdout, NULL);

/* отмена буферизации */ FD_ZERO(&set);

/* очистка маски */ for(f=1;

f < ac;

f++ ) if((fds[nopen].fd = open(av[f], O_RDONLY)) < 0 ){ fprintf(stderr, "Can't read %s\n", av[f] );

continue;

} else { FD_SET(fds[nopen].fd, &set );

/* учесть в маске */ maxfd = max(maxfd, fds[nopen].fd );

strncpy(fds[nopen].name, av[f], sizeof(fds[0].name) - 1);

nopen++;

} if( nopen == 3 ){ fprintf(stderr, "Nothing is opened\n");

exit(1);

} FD_SET(fdin, &set);

/* учесть stdin */ maxfd = max(maxfd, fdin );

nopen -= 2;

/* stdout и stderr не участвуют в select */ timeout.tv_sec = 10;

/* секунд */ timeout.tv_usec = 0;

/* миллисекунд */ /* nfds - это КОЛИЧЕСТВО первых дескрипторов, которые надо * просматривать. Здесь можно использовать * nfds = NOFILE;

(кол-во ВСЕХ дескрипторов ) * или nfds = maxfd+1;

(кол-во = номер последнего+1) * ( +1 т.к. нумерация fd идет с номера 0, а количество - с 1).

*/ nfds = maxfd + 1;

while( nopen ){ rset = set;

rtimeout = timeout;

/* копируем, т.к. изменятся */ /* опрашивать можно FIFO-файлы, терминалы, pty, socket-ы, stream-ы */ nready = select( nfds, &rset, NULL, NULL, &rtimeout );

/* Если вместо &rtimeout написать NULL, то ожидание будет * бесконечным (пока не собьют сигналом) */ if( nready <= 0 ){ /* ничего не поступило */ fprintf(stderr, "Timed out, nopen=%d\n", nopen);

continue;

} А. Богатырёв, 1992-96 - 225 - Си в UNIX™ /* опрос готовых дескрипторов */ for(f=0;

f < nfds;

f++ ) if( FD_ISSET(f, &rset)){ /* дескриптор f готов */ int n;

/* Вызов FIONREAD позволяет запросить * число байт готовых к передаче * через дескриптор.

*/ if(ioctl(f, FIONREAD, &n) < 0) perror("FIONREAD");

else printf("%s have %d bytes.\n", N(f), n);

if((n = read(f, buf, sizeof buf)) <= 0 ){ eof:

FD_CLR(f, &set);

/* исключить */ close(f);

nopen--;

fprintf(stderr, "EOF in %s\n", N(f));

} else { fprintf(stderr, "\n%d bytes from %s:\n", n, N(f));

write(fdout, buf, n);

if( n == 4 && !strncmp(buf, "end\n", 4)) /* ncmp, т.к. buf может не оканчиваться \0 */ goto eof;

} } } exit(0);

} 6.11.2. В качестве самостоятельной работы предлагаем вам пример программы, ведущей протокол сеанса работы. Информацию о псевдотерминалах изучите самостоятельно.

/* * script.c * Программа получения трассировки работы других программ.

* Используется системный вызов опроса готовности каналов * ввода/вывода select() и псевдотерминал (пара ttyp+ptyp).

*/ #include #include #include #include #include #include #include /* NOFILE */ #include #include #include #ifdef TERMIOS # include # define TERMIO struct termios # define GTTY(fd, tadr) tcgetattr(fd, tadr) # define STTY(fd, tadr) tcsetattr(fd, TCSADRAIN, tadr) #else # include # define TERMIO struct termio # define GTTY(fd, tadr) ioctl(fd, TCGETA, tadr) # define STTY(fd, tadr) ioctl(fd, TCSETAW, tadr) #endif А. Богатырёв, 1992-96 - 226 - Си в UNIX™ #ifdef SVR # include /* STREAMS i/o */ extern char *ptsname();

#endif #if defined(ISC2_2) # include #else # include #endif #ifndef BSIZE # define BSIZE #endif #define LOGFILE "/usr/spool/scriptlog" #define max(a,b) ((a) > (b) ? (a) : (b)) extern int errno;

TERMIO told, tnew, ttypmodes;

FILE *fpscript = NULL;

/* файл с трассировкой (если надо) */ int go = 0;

int scriptflg = 0;

int halfflag = 0;

/* HALF DUPLEX */ int autoecho = 0;

char *protocol = "typescript";

#define STDIN 0 /* fileno(stdin) */ #define STDOUT 1 /* fileno(stdout) */ #define STDERR 2 /* fileno(stderr) */ /* какие каналы связаны с терминалом? */ int tty_stdin, tty_stdout, tty_stderr;

int TTYFD;

void wm_checkttys(){ TERMIO t;

tty_stdin = ( GTTY(STDIN, &t) >= 0 );

tty_stdout = ( GTTY(STDOUT, &t) >= 0 );

tty_stderr = ( GTTY(STDERR, &t) >= 0 );

if ( tty_stdin ) TTYFD = STDIN;

else if( tty_stdout ) TTYFD = STDOUT;

else if( tty_stderr ) TTYFD = STDERR;

else { fprintf(stderr, "Cannot access tty\n");

exit(7);

} } /* Описатель трассируемого процесса */ struct ptypair { char line[25];

/* терминальная линия: /dev/ttyp? */ int pfd;

/* дескриптор master pty */ long in_bytes;

/* прочтено байт с клавиатуры */ long out_bytes;

/* послано байт на экран */ int pid;

/* идентификатор процесса */ time_t t_start, t_stop;

/* время запуска и окончания */ char *command;

/* запущенная команда */ } PP;

А. Богатырёв, 1992-96 - 227 - Си в UNIX™ /* Эта функция вызывается при окончании трассируемого процесса * по сигналу SIGCLD */ char Reason[128];

void ondeath(sig){ int pid;

extern void wm_done();

int status;

int fd;

/* выявить причину окончания процесса */ while((pid = wait(&status)) > 0 ){ if( WIFEXITED(status)) sprintf( Reason, "Pid %d died with retcode %d", pid, WEXITSTATUS(status));

else if( WIFSIGNALED(status)) { sprintf( Reason, "Pid %d killed by signal #%d", pid, WTERMSIG(status));

#ifdef WCOREDUMP if(WCOREDUMP(status)) strcat( Reason, " Core dumped" );

#endif } else if( WIFSTOPPED(status)) sprintf( Reason, "Pid %d suspended by signal #%d", pid, WSTOPSIG(status));

} wm_done(0);

} void wm_init(){ wm_checkttys();

GTTY(TTYFD, &told);

/* Сконструировать "сырой" режим для нашего _базового_ терминала */ tnew = told;

tnew.c_cc[VINTR] = '\0';

tnew.c_cc[VQUIT] = '\0';

tnew.c_cc[VERASE] = '\0';

tnew.c_cc[VKILL] = '\0';

#ifdef VSUSP tnew.c_cc[VSUSP] = '\0';

#endif /* CBREAK */ tnew.c_cc[VMIN] = 1;

tnew.c_cc[VTIME] = 0;

tnew.c_cflag &= ~(PARENB|CSIZE);

tnew.c_cflag |= CS8;

tnew.c_iflag &= ~(ISTRIP|ICRNL);

tnew.c_lflag &= ~(ICANON|ECHO|ECHOK|ECHOE|XCASE);

tnew.c_oflag &= ~OLCUC;

/* но оставить c_oflag ONLCR и TAB3, если они были */ /* моды для псевдотерминала */ ttypmodes = told;

/* не выполнять преобразования на выводе:

* ONLCR: \n --> \r\n * TAB3: \t --> пробелы */ ttypmodes.c_oflag &= ~(ONLCR|TAB3);

(void) signal(SIGCLD, ondeath);

} А. Богатырёв, 1992-96 - 228 - Си в UNIX™ void wm_fixtty(){ STTY(TTYFD, &tnew);

} void wm_resettty(){ STTY(TTYFD, &told);

} /* Подобрать свободный псевдотерминал для трассируемого процесса */ struct ptypair wm_ptypair(){ struct ptypair p;

#ifdef SVR p.pfd = (-1);

p.pid = 0;

p.in_bytes = p.out_bytes = 0;

/* Открыть master side пары pty (еще есть slave) */ if((p.pfd = open( "/dev/ptmx", O_RDWR)) < 0 ){ /* Это клонируемый STREAMS driver.

* Поскольку он клонируемый, то есть создающий новое псевдоустройство * при каждом открытии, то на master-стороне может быть только * единственный процесс!

*/ perror( "Open /dev/ptmx" );

goto err;

} # ifdef notdef /* Сделать права доступа к slave-стороне моими. */ if( grantpt (p.pfd) < 0 ){ perror( "grantpt");

exit(errno);

} # endif /* Разблокировать slave-сторону псевдотерминала:

позволить первый open() для нее */ if( unlockpt(p.pfd) < 0 ){ perror( "unlockpt");

exit(errno);

} /* Получить и записать имя нового slave-устройства-файла. */ strcpy( p.line, ptsname(p.pfd));

#else register i;

char c;

struct stat st;

p.pfd = (-1);

p.pid = 0;

p.in_bytes = p.out_bytes = 0;

strcpy( p.line, "/dev/ptyXX" );

А. Богатырёв, 1992-96 - 229 - Си в UNIX™ for( c = 'p';

c <= 's';

c++ ){ p.line[ strlen("/dev/pty") ] = c;

p.line[ strlen("/dev/ptyp")] = '0';

if( stat(p.line, &st) < 0 ) goto err;

for(i=0;

i < 16;

i++){ p.line[ strlen("/dev/ptyp") ] = "0123456789abcdef" [i] ;

if((p.pfd = open( p.line, O_RDWR )) >= 0 ){ p.line[ strlen("/dev/") ] = 't';

return p;

} } } #endif err: return p;

} /* Ведение статистики по вызовам script */ void write_stat( in_bytes, out_bytes, time_here, name, line, at ) long in_bytes, out_bytes;

time_t time_here;

char *name;

char *line;

char *at;

{ FILE *fplog;

struct flock lock;

if((fplog = fopen( LOGFILE, "a" )) == NULL ) return;

lock.l_type = F_WRLCK;

lock.l_whence = 0;

lock.l_start = 0;

lock.l_len = 0;

/* заблокировать весь файл */ fcntl ( fileno(fplog), F_SETLKW, &lock );

fprintf( fplog, "%s (%s) %ld bytes_in %ld bytes_out %ld secs %s %s %s", PP.command, Reason, in_bytes, out_bytes, time_here, name, line, at );

fflush ( fplog );

lock.l_type = F_UNLCK;

lock.l_whence = 0;

lock.l_start = 0;

lock.l_len = 0;

/* разблокировать весь файл */ fcntl ( fileno(fplog), F_SETLK, &lock );

fclose ( fplog );

} А. Богатырёв, 1992-96 - 230 - Си в UNIX™ void wm_done(sig){ char *getlogin(), *getenv(), *logname = getlogin();

time( &PP.t_stop );

/* запомнить время окончания */ wm_resettty();

/* восстановить режим базового терминала */ if( fpscript ) fclose(fpscript);

if( PP.pid > 0 ) kill( SIGHUP, PP.pid );

/* "обрыв связи" */ if( go ) write_stat( PP.in_bytes, PP.out_bytes, PP.t_stop - PP.t_start, logname ? logname : getenv("LOGNAME"), PP.line, ctime(&PP.t_stop) );

printf( "\n" );

exit(0);

} /* Запуск трассируемого процесса на псевдотерминале */ void wm_startshell (ac, av) char **av;

{ int child, fd, sig;

if( ac == 0 ){ static char *avshell[] = { "/bin/sh", "-i", NULL };

av = avshell;

} if((child = fork()) < 0 ){ perror("fork");

wm_done(errno);

} if( child == 0 ){ /* SON */ if( tty_stdin ) setpgrp();

/* отказ от управляющего терминала */ /* получить новый управляющий терминал */ if((fd = open( PP.line, O_RDWR )) < 0 ){ exit(errno);

} /* закрыть лишние каналы */ if( fpscript ) fclose(fpscript);

close( PP.pfd );

#ifdef SVR /* Push pty compatibility modules onto stream */ ioctl(fd, I_PUSH, "ptem");

/* pseudo tty module */ ioctl(fd, I_PUSH, "ldterm");

/* line discipline module */ ioctl(fd, I_PUSH, "ttcompat");

/* BSD ioctls module */ #endif А. Богатырёв, 1992-96 - 231 - Си в UNIX™ /* перенаправить каналы, связанные с терминалом */ if( fd != STDIN && tty_stdin ) dup2(fd, STDIN);

if( fd != STDOUT && tty_stdout ) dup2(fd, STDOUT);

if( fd != STDERR && tty_stderr ) dup2(fd, STDERR);

if( fd > STDERR ) (void) close(fd);

/* установить моды терминала */ STTY(TTYFD, &ttypmodes);

/* восстановить реакции на сигналы */ for(sig=1;

sig < NSIG;

sig++) signal( sig, SIG_DFL );

execvp(av[0], av);

system( "echo OBLOM > HELP.ME");

perror("execl");

exit(errno);

} else { /* FATHER */ PP.pid = child;

PP.command = av[0];

time( &PP.t_start );

PP.t_stop = PP.t_start;

signal( SIGHUP, wm_done );

signal( SIGINT, wm_done );

signal( SIGQUIT, wm_done );

signal( SIGTERM, wm_done );

signal( SIGILL, wm_done );

signal( SIGBUS, wm_done );

signal( SIGSEGV, wm_done );

} } char buf[ BSIZE ];

/* буфер для передачи данных */ /* /dev/pty? /dev/ttyp?

экран *--------* *--------* /||| | | PP.pfd | | |||||<-STDOUT--| мой |<---------| псевдо |<-STDOUT---| \||| |терминал| |терминал|<-STDERR---|трассируемый |(базовый) | | |процесс ------- | | STDIN | | | |.....|-STDIN--> |----------> |--STDIN--->| |_| | | | | клавиатура *--------* *--------* master slave */ А. Богатырёв, 1992-96 - 232 - Си в UNIX™ /* Опрос дескрипторов */ void wm_select(){ int nready;

int nfds;

int maxfd;

int nopen;

/* число опрашиваемых дескрипторов */ register f;

fd_set set, rset;

/* маски */ struct timeval timeout, rtimeout;

FD_ZERO(&set);

nopen = 0;

/* очистка маски */ FD_SET (PP.pfd, &set);

nopen++;

/* учесть в маске */ FD_SET (STDIN, &set);

nopen++;

maxfd = max(PP.pfd, STDIN);

timeout.tv_sec = 3600;

/* секунд */ timeout.tv_usec = 0;

/* миллисекунд */ nfds = maxfd + 1;

while( nopen ){ rset = set;

rtimeout = timeout;

/* опросить дескрипторы */ if((nready = select( nfds, &rset, NULL, NULL, &rtimeout )) <= 0) continue;

for(f=0;

f < nfds;

f++ ) if( FD_ISSET(f, &rset)){ /* дескриптор f готов */ int n;

if((n = read(f, buf, sizeof buf)) <= 0 ){ FD_CLR(f, &set);

nopen--;

/* исключить */ close(f);

} else { int fdout;

/* учет и контроль */ if( f == PP.pfd ){ fdout = STDOUT;

PP.out_bytes += n;

if( fpscript ) fwrite(buf, 1, n, fpscript);

} else if( f == STDIN ) { fdout = PP.pfd;

PP.in_bytes += n;

if( halfflag && fpscript ) fwrite(buf, 1, n, fpscript);

if( autoecho ) write(STDOUT, buf, n);

} write(fdout, buf, n);

} } } } А. Богатырёв, 1992-96 - 233 - Си в UNIX™ int main(ac, av) char **av;

{ while( ac > 1 && *av[1] == '-' ){ switch(av[1][1]){ case 's':

scriptflg++;

break;

case 'f':

av++;

ac--;

protocol = av[1];

scriptflg++;

break;

case 'h':

halfflag++;

break;

case 'a':

autoecho++;

break;

default:

fprintf(stderr, "Bad key %s\n", av[1]);

break;

} ac--;

av++;

} if( scriptflg ){ fpscript = fopen( protocol, "w" );

} ac--;

av++;

wm_init();

PP = wm_ptypair();

if( PP.pfd < 0 ){ fprintf(stderr, "Cannot get pty. Please wait and try again.\n");

return 1;

} wm_fixtty();

wm_startshell(ac, av);

go++;

wm_select();

wm_done(0);

/* NOTREACHED */ return 0;

} 6.12. Простой интерпретатор команд.

Данный раздел просто приводит исходный текст простого интерпретатора команд. Функция match описана в главе "Текстовая обработка".

/* Примитивный интерпретатор команд. Распознает построчно * команды вида: CMD ARG1... ARGn FILE >>FILE >&FILE >>&FILE * Сборка: cc -U42 -DCWDONLY sh.c match.c pwd.c -o sh */ #include /* определение типов, используемых системой */ #include /* описание библиотеки ввода/вывода */ #include /* описание сигналов */ #include /* определение O_RDONLY */ #include /* коды системных ошибок */ #include /* макросы для работы с символами */ #include /* эмуляция файловой системы BSD 4.2 */ #include /* работа с /etc/passwd */ #include /* описание формата wait() */ А. Богатырёв, 1992-96 - 234 - Си в UNIX™ char cmd[256];

/* буфер для считывания команды */ #define MAXARGS 256 /* макс. количество аргументов */ char *arg[MAXARGS];

/* аргументы команды */ char *fin, *fout;

/* имена для перенаправления ввода/вывода */ int rout;

/* флаги перенаправления вывода */ char *firstfound;

/* имя найденной, но невыполняемой программы */ #define LIM ':' /* разделитель имен каталогов в path */ extern char *malloc(), *getenv(), *strcpy(), *getwd();

extern char *strchr(), *execat();

extern void callshell(), printenv(), setenv(), dowait(), setcwd();

extern struct passwd *getpwuid();

/* Предопределенные переменные */ extern char **environ;

/* окружение: изначально смотрит на тот же * массив, что и ev из main() */ extern int errno;

/* код ошибки системного вызова */ char *strdup(s)char *s;

{ char *p;

return(p=malloc(strlen(s)+1), strcpy(p,s));

} /* strcpy() возвращает свой первый аргумент */ char *str3spl(s, p, q) char *s, *p, *q;

{ char *n = malloc(strlen(s)+strlen(p)+strlen(q)+1);

strcpy(n, s);

strcat(n, p);

strcat(n, q);

return n;

} int cmps(s1, s2) char **s1, **s2;

{ return strcmp(*s1, *s2);

} /* Перенаправить вывод */ #define APPEND 0x #define ERRTOO 0x int output (name, append, err_too, created) char *name;

int *created;

{ int fd;

*created = 0;

/* Создан ли файл ? */ if( append ){ /* >>file */ /* Файл name существует? Пробуем открыть на запись */ if((fd = open (name, O_WRONLY)) < 0) { if (errno == ENOENT) /* Файл еще не существовал */ goto CREATE;

else return 0;

/* Не имеем права писать в этот файл */ } /* иначе fd == открытый файл, *created == 0 */ }else{ CREATE: /* Пытаемся создать (либо опустошить) файл "name" */ if((fd = creat (name, 0666)) < 0 ) return 0;

/* Не могу создать файл */ else *created = 1;

/* Был создан новый файл */ } if (append) lseek (fd, 0l, 2);

/* на конец файла */ /* перенаправить стандартный вывод */ dup2(fd, 1);

if( err_too ) dup2(fd, 2);

/* err_too=1 для >& */ close(fd);

return 1;

} А. Богатырёв, 1992-96 - 235 - Си в UNIX™ /* Перенаправить ввод */ int input (name) char *name;

{ int fd;

if((fd = open (name, O_RDONLY)) < 0 ) return 0;

/* Не могу читать */ /* перенаправить стандартный ввод */ dup2(fd, 0);

close(fd);

return 1;

} /* запуск команды */ int cmdExec(progr, av, envp, inp, outp, outflg) char *progr;

/* имя программы */ char **av;

/* список аргументов */ char **envp;

/* окружение */ char *inp, *outp;

/* файлы ввода-вывода (перенаправления) */ int outflg;

/* режимы перенаправления вывода */ { void (*del)(), (*quit)();

int pid;

int cr = 0;

del = signal(SIGINT, SIG_IGN);

quit = signal(SIGQUIT, SIG_IGN);

if( ! (pid = fork())){ /* ветвление */ /* порожденный процесс (сын) */ signal(SIGINT, SIG_DFL);

/* восстановить реакции */ signal(SIGQUIT,SIG_DFL);

/* по умолчанию */ /* getpid() выдает номер (идентификатор) данного процесса */ printf( "Процесс pid=%d запущен\n", pid = getpid());

/* Перенаправить ввод-вывод */ if( inp ) if(!input( inp )){ fprintf(stderr, "Не могу <%s\n", inp );

goto Err;

} if( outp ) if(!output (outp, outflg & APPEND, outflg & ERRTOO, &cr)){ fprintf(stderr, "Не могу >%s\n", outp );

goto Err;

} /* Заменить программу: при успехе * данная программа завершается, а вместо нее вызывается * функция main(ac, av, envp) программы, хранящейся в файле progr.

* ac вычисляет система.

*/ execvpe(progr, av, envp);

Err:

/* при неудаче печатаем причину и завершаем порожденный процесс */ perror(firstfound ? firstfound: progr);

/* Мы не делаем free(firstfound),firstfound = NULL * потому что данный процесс завершается (и тем ВСЯ его * память освобождается) :

*/ if( cr && outp ) /* был создан новый файл */ unlink(outp);

/* но теперь он нам не нужен */ exit(errno);

} /* процесс - отец */ /* Сейчас сигналы игнорируются, wait не может быть оборван * прерыванием с клавиатуры */ dowait();

/* ожидать окончания сына */ /* восстановить реакции на сигналы от клавиатуры */ signal(SIGINT, del);

signal(SIGQUIT, quit);

return pid;

/* вернуть идентификатор сына */ } А. Богатырёв, 1992-96 - 236 - Си в UNIX™ /* Запуск программы с поиском по переменной среды PATH */ int execvpe(progr, av, envp) char *progr, **av, **envp;

{ char *path, *cp;

int try = 1;

register eacces = 0;

char fullpath[256];

/* полное имя программы */ firstfound = NULL;

if((path = getenv("PATH")) == NULL ) path = ".:/bin:/usr/bin:/etc";

/* имя: короткое или путь уже задан ? */ cp = strchr(progr, '/') ? "" : path;

do{ /* пробуем разные варианты */ cp = execat(cp, progr, fullpath);

retry:

fprintf(stderr, "пробуем \"%s\"\n", fullpath );

execve(fullpath, av, envp);

/* если программа запустилась, то на этом месте данный * процесс заменился новой программой. Иначе - ошибка. */ switch( errno ){ /* какова причина неудачи ? */ case ENOEXEC: /* это командный файл */ callshell(fullpath, av, envp);

return (-1);

case ETXTBSY: /* файл записывается */ if( ++try > 5 ) return (-1);

sleep(try);

goto retry;

case EACCES: /* не имеете права */ if(firstfound == NULL) firstfound = strdup(fullpath);

eacces++;

break;

case ENOMEM: /* программа не лезет в память */ case E2BIG:

return (-1);

} }while( cp );

if( eacces ) errno = EACCES;

return (-1);

} /* Склейка очередной компоненты path и имени программы name */ static char *execat(path, name, buf) register char *path, *name;

char *buf;

/* где будет результат */ { register char *s = buf;

while(*path && *path != LIM ) *s++ = *path++;

/* имя каталога */ if( s != buf ) *s++ = '/';

while( *name ) *s++ = *name++;

/* имя программы */ *s = '\0';

return ( *path ? ++path /* пропустив LIM */ : NULL );

} А. Богатырёв, 1992-96 - 237 - Си в UNIX™ /* Запуск командного файла при помощи вызова интерпретатора */ void callshell(progr, av, envp) char *progr, **av, **envp;

{ register i;

char *sh;

char *newav[MAXARGS+2];

int fd;

char first = 0;

if((fd = open(progr, O_RDONLY)) < 0 ) sh = "/bin/sh";

else{ read(fd, &first, 1);

close(fd);

sh = (first == '#') ? "/bin/csh" : "/bin/sh";

} newav[0] = "Shellscript";

newav[1] = progr;

for(i=1;

av[i];

i++) newav[i+1] = av[i];

newav[i+1] = NULL;

printf( "Вызываем %s\n", sh );

execve(sh, newav, envp);

} /* Ожидать окончания всех процессов, выдать причины смерти. */ void dowait(){ int ws;

int pid;

while((pid = wait( &ws)) > 0 ){ if( WIFEXITED(ws)){ printf( "Процесс %d умер с кодом %d\n", pid, WEXITSTATUS(ws));

}else if( WIFSIGNALED(ws)){ printf( "Процесс %d убит сигналом %d\n", pid, WTERMSIG(ws));

if(WCOREDUMP(ws)) printf( "Образовался core\n" );

/* core - образ памяти процесса для отладчика adb */ }else if( WIFSTOPPED(ws)){ printf( "Процесс %d остановлен сигналом %d\n", pid, WSTOPSIG(ws));

} } } А. Богатырёв, 1992-96 - 238 - Си в UNIX™ /* Расширение шаблонов имен. Это упрощенная версия, которая * расширяет имена только в текущем каталоге.

*/ void glob(dir, args, indx, str /* что расширять */, quote ) char *args[], *dir;

int *indx;

char *str;

char quote;

/* кавычки, в которые заключена строка str */ { static char globchars[] = "*?[";

char *p;

char **start = &args[ *indx ];

short nglobbed = 0;

register struct dirent *dirbuf;

DIR *fd;

extern DIR *opendir();

/* Затычка для отмены глоббинга: */ if( *str == '\\' ){ str++;

goto noGlob;

} /* Обработка переменных $NAME */ if( *str == '$' && quote != '\'' ){ char *s = getenv(str+1);

if( s ) str = s;

} /* Анализ: требуется ли глоббинг */ if( quote ) goto noGlob;

for( p=str;

*p;

p++ ) /* Есть ли символы шаблона? */ if( strchr(globchars, *p)) goto doGlobbing;

noGlob:

args[ (*indx)++ ] = strdup(str);

return;

doGlobbing:

if((fd = opendir (dir)) == NULL){ fprintf(stderr, "Can't read %s\n", dir);

return;

} while ((dirbuf = readdir (fd)) != NULL ) { if (dirbuf->d_ino == 0) continue;

if (strcmp (dirbuf->d_name, ".") == 0 || strcmp (dirbuf->d_name, "..") == 0) continue;

if( match( dirbuf->d_name, str)){ args[ (*indx)++ ] = strdup(dirbuf->d_name);

nglobbed++;

} } closedir(fd);

if( !nglobbed){ printf( "%s: no match\n", str);

goto noGlob;

}else{ /* отсортировать */ qsort(start, nglobbed, sizeof (char *), cmps);

} } /* Разбор командной строки */ int parse(s) register char *s;

{ int i;

register char *p;

char tmp[80];

/* очередной аргумент */ char c;

/* очистка старых аргументов */ for(i=0;

arg[i];

i++) free(arg[i]), arg[i] = NULL;

if( fin ) free(fin ), fin = NULL;

if( fout ) free(fout), fout = NULL;

rout = 0;

А. Богатырёв, 1992-96 - 239 - Си в UNIX™ /* разбор строки */ for( i=0 ;

;

){ char quote = '\0';

/* пропуск пробелов - разделителей слов */ while((c = *s) && isspace(c)) s++;

if( !c ) break;

/* очередное слово */ p = tmp;

if(*s == '\'' || *s == '"' ){ /* аргумент в кавычках */ quote = *s++;

/* символ кавычки */ while((c = *s) != '\0' && c != quote){ if( c == '\\' ){ /* заэкранировано */ c = *++s;

if( !c ) break;

} *p++ = c;

++s;

} if(c == '\0') fprintf(stderr, "Нет закрывающей кавычки %c\n", quote);

else s++;

/* проигнорировать кавычку на конце */ } else while((c = *s) && !isspace(c)){ if(c == '\\') /* заэкранировано */ if( !(c = *++s)) break /* while */;

*p++ = c;

s++;

} *p = '\0';

/* Проверить, не есть ли это перенаправление * ввода/вывода. В отличие от sh и csh * здесь надо писать >ФАЙЛ <ФАЙЛ * >< вплотную к имени файла.

*/ p = tmp;

/* очередное слово */ if( *p == '>'){ /* перенаправлен вывод */ p++;

if( fout ) free(fout), rout = 0;

/* уже было */ if( *p == '>' ){ rout |= APPEND;

p++;

} if( *p == '&' ){ rout |= ERRTOO;

p++;

} if( !*p ){ fprintf(stderr, "Нет имени для >\n");

fout = NULL;

rout = 0;

} else fout = strdup(p);

} else if( *p == '<' ){ /* перенаправлен ввод */ p++;

if( fin ) free(fin);

/* уже было */ if( !*p ){ fprintf(stderr, "Нет имени для <\n");

fin = NULL;

} else fin = strdup(p);

} else /* добавить имена к аргументам */ glob( ".", arg, &i, p, quote );

} arg[i] = NULL;

return i;

} А. Богатырёв, 1992-96 - 240 - Си в UNIX™ /* Установить имя пользователя */ void setuser(){ int uid = getuid();

/* номер пользователя, запустившего Шелл */ char *user = "mr. Nobody";

/* имя пользователя */ char *home = "/tmp";

/* его домашний каталог */ struct passwd *pp = getpwuid( uid );

if( pp != NULL ){ if(pp->pw_name && *pp->pw_name ) user = pp->pw_name;

if( *pp->pw_dir ) home = pp->pw_dir;

} setenv("USER", user);

setenv("HOME", home);

} void setcwd(){ /* Установить имя текущего каталога */ char cwd[512];

getwd(cwd);

setenv( "CWD", cwd );

} void main(ac, av, ev) char *av[], *ev[];

{ int argc;

/* количество аргументов */ char *prompt;

/* приглашение */ setuser();

setcwd();

signal(SIGINT, SIG_IGN);

setbuf(stdout, NULL);

/* отменить буферизацию */ for(;

;

){ prompt = getenv( "prompt" );

/* setenv prompt -->\ */ printf( prompt ? prompt : "@ ");

/* приглашение */ if( gets(cmd) == NULL /* at EOF */ ) exit(0);

argc = parse(cmd);

if( !argc) continue;

if( !strcmp(arg[0], "exit" )) exit(0);

if( !strcmp(arg[0], "cd" )){ char *d = (argc==1) ? getenv("HOME"):arg[1];

if(chdir(d) < 0) printf( "Не могу войти в %s\n", d );

else setcwd();

continue;

} if( !strcmp(arg[0], "echo" )){ register i;

FILE *fp;

if( fout ){ if((fp = fopen(fout, rout & APPEND ? "a":"w")) == NULL) continue;

} else fp = stdout;

for(i=1;

i < argc;

i++ ) fprintf( fp, "%s%s", arg[i], i == argc-1 ? "\n":" ");

if( fp != stdout ) fclose(fp);

continue;

} if( !strcmp(arg[0], "setenv" )){ if( argc == 1 ) printenv();

else if( argc == 2 ) setenv( arg[1], "" );

else setenv( arg[1], arg[2]);

continue;

} cmdExec(arg[0], (char **) arg, environ, fin, fout, rout);

} } А. Богатырёв, 1992-96 - 241 - Си в UNIX™ /* -----------------------------------------------------------*/ /* Отсортировать и напечатать окружение */ void printenv(){ char *e[40];

register i = 0;

char *p, **q = e;

do{ p = e[i] = environ[i];

i++;

} while( p );

#ifdef SORT qsort( e, --i /* сколько */, sizeof(char *), cmps);

#endif while( *q ) printf( "%s\n", *q++ );

} /* Сравнение имени переменной окружения с name */ static char *envcmp(name, evstr) char *name, *evstr;

{ char *p;

int code;

if((p = strchr(evstr, '=')) == NULL ) return NULL;

/* error ! */ *p = '\0';

/* временно */ code = strcmp(name, evstr);

*p = '=';

/* восстановили */ return code==0 ? p+1 : NULL;

} /* Установить переменную окружения */ void setenv( name, value ) char *name, *value;

{ static malloced = 0;

/* 1, если environ перемещен */ char *s, **p, **newenv;

int len, change_at = (-1), i;

/* Есть ли переменная name в environ-е ? */ for(p = environ;

*p;

p++ ) if(s = envcmp(name, *p)){ /* уже есть */ if((len = strlen(s)) >= strlen(value)){ /* достаточно места */ strcpy(s, value);

return;

} /* Если это новый environ... */ if( malloced ){ free( *p );

*p = str3spl(name, "=", value);

return;

} /* иначе создаем копию environ-а */ change_at = p - environ;

/* индекс */ break;

} /* Создаем копию environ-а. Если change_at == (-1), то * резервируем новую ячейку для еще не определенной переменной */ for(p=environ, len=0;

*p;

p++, len++ );

/* вычислили количество переменных */ if( change_at < 0 ) len++;

if((newenv = (char **) malloc( sizeof(char *) * (len+1))) == (char **) NULL) return;

for(i=0;

i < len+1;

i++ ) newenv[i] = NULL;

/* зачистка */ /* Копируем старый environ в новый */ if( !malloced ) /* исходный environ в стеке (дан системой) */ for(i=0;

environ[i];

i++ ) newenv[i] = strdup(environ[i]);

else for(i=0;

environ[i];

i++ ) newenv[i] = environ[i];

/* Во втором случае строки уже были спасены, копируем ссылки */ А. Богатырёв, 1992-96 - 242 - Си в UNIX™ /* Изменяем, если надо: */ if( change_at >= 0 ){ free( newenv[change_at] );

newenv[change_at] = str3spl(name, "=", value);

} else { /* добавить в конец новую переменную */ newenv[len-1] = str3spl(name, "=", value);

} /* подменить environ */ if( malloced ) free( environ );

environ = newenv;

malloced++;

qsort( environ, len, sizeof(char *), cmps);

} /* Допишите команды:

unsetenv имя_переменной - удаляет переменную среды;

exit N - завершает интерпретатор с кодом возврата N (это целое число);

*/ А. Богатырёв, 1992-96 - 243 - Си в UNIX™ 7. Текстовая обработка.

Под "текстовой обработкой" (в противовес "вычислительным задачам") здесь понимается огромный класс задач обработки информации нечислового характера, например редактирование текста, форматиро вание документов, поиск и сортировка, базы данных, лексический и синтаксический анализ, печать на прин тере, преобразование формата таблиц, и.т.п.

7.1. Напишите программу, "угадывающую" слово из заранее заданного списка по первым нескольким буквам. Выдайте сообщение "неоднозначно", если есть несколько похожих слов. Усложните программу так, чтобы список слов считывался в программу при ее запуске из файла list.txt 7.2. Напишите программу, которая удваивает пробелы в тексте с одиночными пробелами.

7.3. Напишите программу, которая копирует ввод на вывод, заменяя каждую последовательность из иду щих подряд нескольких пробелов и/или табуляций на один пробел. Схема ее решения сходна с решением следующей задачи.

7.4. Напишите программу подсчета слов в файле. Слово определите как последовательность символов, не включающую символы пробела, табуляции или новой строки. "Канонический" вариант решения, приведен ный у Кернигана и Ритчи, таков:

#include #include const int YES=1, NO=0;

main(){ register int inWord = NO;

/* состояние */ int words = 0, c;

while((c = getchar()) != EOF) if(isspace(c) || c == '\n') inWord = NO;

else if(inWord == NO){ inWord = YES;

++words;

} printf("%d слов\n", words);

} Обратите внимание на конструкцию const. Это объявление имен как констант. Эта конструкция близка к #define YES но позволяет компилятору • более строго проверять тип, т.к. это типизированная константа;

• создавать более экономный код;

• запрещает изменять это значение.

Рассмотрим пример main(){ /* cc 00.c -o 00 -lm */ double sqrt(double);

const double sq12 = sqrt(12.0);

#define SQRT2 sqrt(2.0) double x;

x = sq12 * sq12 * SQRT2 * SQRT2;

/* @1 */ sq12 = 3.4641;

/* @2 */ printf("%g %g\n", sq12, x);

} Использование #define превратит строку @1 в x = sq12 * sq12 * sqrt(2.0) * sqrt(2.0);

то есть создаст код с двумя вызовами функции sqrt. Конструкция же const заносит вычисленное выраже ние в ячейку памяти и далее просто использует ее значение. При этом компилятор не позволяет впослед ствии изменять это значение, поэтому строка @2 ошибочна.

Теперь предложим еще одну программу подсчета слов, где слово определяется макросом isWord, перечисляющим буквы допустимые в слове. Программа основана на переключательной таблице функций (этот подход применим во многих случаях):

#include #include int wordLength, inWord, words;

/* = 0 */ char aWord[128], *wrd;

А. Богатырёв, 1992-96 - 244 - Си в UNIX™ void space (c){} void letter (c){ wordLength++;

*wrd++ = c;

} void begWord(c){ wordLength=0;

inWord=1;

wrd=aWord;

words++;

letter(c);

} void endWord(c){ inWord=0;

*wrd = '\0';

printf("Слово '%s' длины %d\n", aWord, wordLength);

} void (*sw[2][2])() = { /* !isWord */ { space, endWord }, /* isWord */ { begWord, letter } /* !inWord inWord */ };

#define isWord(c) (isalnum(c) || c=='-' || c=='_') main(){ register c;

while((c = getchar()) != EOF) (*sw[isWord(c)][inWord])(c);

printf("%d слов\n", words);

} 7.5. Напишите программу, выдающую гистограмму длин строк файла (т.е. таблицу: строк длины 0 столько то, длины 1 - столько-то, и.т.п., причем таблицу можно изобразить графически).

7.6. Напишите программу, которая считывает слово из файла in и записывает это слово в конец файла out.

7.7. Напишите программу, которая будет печатать слова из файла ввода, причем по одному на строку.

7.8. Напишите программу, печатающую гистограмму длин слов из файла ввода.

7.9. Напишите программу, читающую слова из файла и размещающую их в виде двунаправленного списка слов, отсортированного по алфавиту. Указания: используйте динамическую память (malloc) и указатели;

напишите функцию включения нового слова в список на нужное место.

В конце работы распечатайте список дважды: в прямом и в обратном порядке.

Усложнение: не хранить в списке дубликаты;

вместо этого вместе со словом хранить счетчик количе ства его вхождений в текст.

7.10. Напишите программу, которая печатает слова из своего файла ввода, расположенные в порядке убы вания частоты их появления. Перед каждым словом напечатайте число частоты его появления.

7.11. Напишите программу, читающую файл построчно и печатающую слова в каждой строке в обратном порядке.

7.12. Напишите программу копирования ввода на вывод таким образом, чтобы из каждой группы последо вательно одинаковых строк выводилась только одна строка. Это аналог программы uniq в системе UNIX.

Ответ:

#include /* char *gets();

*/ char buf1[4096], buf2[4096];

char *this = buf1, *prev = buf2;

main(){ long nline =0L;

char *tmp;

while( gets(this)){ if(nline){ /* сравнить новую и предыдущую строки */ if( strcmp(this, prev)) /* различны ? */ puts(prev);

} /* обмен буферов: */ tmp=prev;

prev=this;

this=tmp;

nline++;

/* номер строки */ }/* endwhile */ if( nline ) puts(prev);

/* последняя строка всегда выдается */ } А. Богатырёв, 1992-96 - 245 - Си в UNIX™ 7.13. Составьте программу, которая будет удалять в конце (и в начале) каждой строки файла пробелы и табуляции, а также удалять строки, целиком состоящие из пробелов и табуляций.

7.14. Для экономии места в файле, редакторы текстов при записи отредактированного файла сжимают подряд идущие пробелы в табуляцию. Часто это неудобно для программ обработки текстов (поскольку тре бует особой обработки табуляций - это ОДИН символ, который на экране и в тексте занимает НЕСКОЛЬКО позиций!), поэтому при чтении файла мы должны расширять табуляции в нужное количество пробелов, например так:

/* заменять табуляции на пробелы */ void untab(s) register char *s;

{ char newstr[256];

/* новая строка */ char *src = s;

int n;

/* счетчик */ register dstx;

/* координата x в новой строке */ for(dstx = 0;

*s != '\0';

s++) if( *s == '\t'){ for(n = 8 - dstx % 8 ;

n > 0 ;

n--) newstr[dstx++] = ' ';

}else newstr[dstx++] = *s;

newstr[dstx] = '\0';

strcpy(src, newstr);

/* строку на старое место */ } 7.15. Напишите обратную функцию, сжимающую подряд идущие пробелы в табуляции.

void tabify(){ int chr;

int icol, ocol;

/* input/output columns */ for(icol = ocol = 0;

;

){ if((chr = getchar()) == EOF) break;

switch(chr){ case ' ':

icol++;

break;

case '\n':

case '\r':

ocol = icol = 0;

putchar(chr);

break;

case '\t':

icol += 8;

icol &= ~07;

/* icol -= icol % 8;

*/ break;

А. Богатырёв, 1992-96 - 246 - Си в UNIX™ default:

while(((ocol + 8) & ~07) <= icol){ #ifdef NOTDEF if(ocol + 1 == icol) break;

/* взять ' ' вместо '\t' */ #endif putchar('\t');

ocol += 8;

ocol &= ~07;

} while(ocol < icol){ putchar(' ');

ocol++;

} putchar(chr);

icol++;

ocol++;

break;

} } } 7.16. Составьте программу, укорачивающую строки исходного файла до заданной величины и помещаю щую результат в указанный файл. Учтите, что табуляция разворачивается в несколько пробелов!

7.17. Разработайте программу, укорачивающую строки входного файла до 60 символов. Однако теперь запрещается обрубать слова.

7.18. Разработайте программу, заполняющую промежутки между словами строки дополнительными пробе лами таким образом, чтобы длина строки была равна 60 символам.

7.19. Напишите программу, переносящую слишком длинные строки. Слова разбивать нельзя (неумешаю щееся слово следует перенести целиком). Ширину строки считать равной 60.

7.20. Составьте программу, центрирующую строки файла относительно середины экрана, т.е. добавляю щую в начало строки такое количество пробелов, чтобы середина строки печаталась в 40-ой позиции (счи таем, что обычный экран имеет ширину 80 символов).

7.21. Напишите программу, отсекающую n пробелов в начале каждой строки (или n первых любых симво лов). Учтите, что в файле могут быть строки короче n (например пустые строки).

#include /*... текст функции untab();

... */ void process(char name[], int n, int spacesOnly){ char line[256];

int length, shift, nline = 0;

char newname[128];

FILE *fpin, *fpout;

if((fpin = fopen(name, "r")) == NULL){ fprintf(stderr, "Не могу читать %s\n", name);

return;

} sprintf(newname, "_%s", name);

/* например */ if((fpout = fopen(newname, "w")) == NULL){ fprintf(stderr, "Не могу создать %s\n", newname);

fclose(fpin);

return;

} while(fgets(line, sizeof line, fpin)){ ++nline;

if((length = strlen(line)) && line[length-1] == '\n') line[--length] = '\0';

/* обрубить '\n' */ untab(line);

/* развернуть табуляции */ for(shift=0;

line[shift] != '\0' && shift < n ;

++shift) if(spacesOnly && line[shift] != ' ') break;

А. Богатырёв, 1992-96 - 247 - Си в UNIX™ if(*line && shift != n ) /* Предупреждение */ fprintf(stderr, "Начало строки #%d слишком коротко\n", nline);

fprintf(fpout, "%s\n", line+shift);

/* нельзя было fputs(line+n, fpout);

* т.к. эта позиция может быть ЗА концом строки */ } fclose(fpin);

fclose(fpout);

} void main(int argc, char **argv){ if( argc != 3 ) exit(1);

process(argv[2], atoi(argv[1]) /* 8 */, 1);

exit(0);

} 7.22. Напишите программу, разбивающую файл на два по вертикали: в первый файл попадает левая поло вина исходного файла, во второй - правая. Ширину колонки задавайте из аргументов main(). Если же аргу мент не указан - 40 позиций.

7.23. Напишите программу сортировки строк в алфавитном порядке. Учтите, что функция strcmp() сравни вает строки в порядке кодировки, принятой на данной конкретной машине. Русские буквы, как правило, идут не в алфавитном порядке! Следует написать функцию для алфавитного сравнения отдельных символов и, пользуясь ею, переписать функцию strcmp().

7.24. Отсортируйте массив строк по лексикографическому убыванию, игнорируя различия между строч ными и прописными буквами.

7.25. Составьте программу дихотомического поиска в отсортированном массиве строк (методом деления пополам).

А. Богатырёв, 1992-96 - 248 - Си в UNIX™ /* Поиск в таблице методом половинного деления: dihotomia */ #include struct elem { char *name;

/* ключ поиска */ int value;

} table[] = { /* имена строго по алфавиту */ { "andrew", 17 }, { "bill", 23 }, { "george", 55 }, { "jack", 54 }, { "jaw", 43 }, { "john", 33 }, { "mike", 99 }, { "paul", 21 }, { "sue", 66 }, /* SIZE - 2 */ { NULL, -1 }, /* SIZE - 1 */ /* NULL введен только для распечатки таблицы */ };

#define SIZE (sizeof(table) / sizeof(struct elem)) /* Дихотомический поиск по таблице */ struct elem *find(s, table, size) char *s;

/* что найти ? */ struct elem table[];

/* в чем ? */ int size;

/* среди первых size элементов */ { register top, bottom, middle;

register code;

top = 0;

/* начало */ bottom = size - 1;

/* конец: индекс строки "sue" */ while( top <= bottom ){ middle = (top + bottom) / 2;

/* середина */ /* сравнить строки */ code = strcmp( s, table[middle].name ) ;

if( code > 0 ){ top = middle + 1;

}else if( code < 0 ){ bottom = middle - 1;

}else return &table[ middle ];

} return (struct elem *) NULL;

/* не нашел */ } А. Богатырёв, 1992-96 - 249 - Си в UNIX™ /* распечатка таблицы */ void printtable(tbl) register struct elem *tbl;

{ for( ;

tbl->name != NULL ;

tbl++ ){ printf( "%-15s %d\n", tbl->name, tbl->value );

} } int main(){ char buf[80];

struct elem *ptr;

printtable(table);

for(;

;

){ printf( "-> " );

if( gets( buf ) == NULL) break;

/* EOF */ if( ! strcmp( buf, "q" )) exit(0);

/* quit: выход */ ptr = find( buf, table, SIZE-1 );

if( ptr ) printf( "%d\n", ptr->value );

else { printf( "--- Не найдено ---\n" );

printtable(table);

} } return 0;

} 7.26. Напишем функцию, которая преобразует строку так, что при ее печати буквы в ней будут подчерк нуты, а цифры - выделены жирно. Формат текста с выделениями, который создается этим примером, явля ется общепринятым в UNIX и распознается некоторыми программами: например, программа просмотра файлов less (more) выделяет такие буквы на экране специальными шрифтами или инверсией фона.

#define LEN 9 /* потом напишите 256 */ char input[] = "(xxx+yyy)/123.75=?";

char output[LEN];

void main( void ){ int len=LEN, i;

void bi_conv();

char c;

bi_conv(input, output, &len);

if(len > LEN){ printf("Увеличь LEN до %d\n", len);

len = LEN;

/* доступный максимум */ } for(i=0;

i < len && (c = output[i]);

++i) putchar(c);

putchar('\n');

} /* Заметьте, что include-файлы не обязательно * должны включаться в самом начале программы! */ #include #include #define PUT(c) { count++;

\ if(put < *len){ *p++ = (c);

++put;

}} #define GET() (*s ? *s++ : EOF) void bi_conv( /*IN*/ char *s, /*OUT*/ char *p, /*INOUT*/ int *len ){ int count, put, c;

for(count=put=0;

(c=GET()) != EOF;

){ /* жирный: C\bC */ /* подчеркнутый: _\bC */ if(isalpha(c)){ PUT('_');

PUT('\b');

} А. Богатырёв, 1992-96 - 250 - Си в UNIX™ else if(isdigit(c)){ PUT( c );

PUT('\b');

} PUT(c);

} PUT('\0');

/* закрыть строку */ *len = count;

#undef PUT #undef GET } Напишите программу для подобной обработки файла. Заметим, что для этого не нужны промежуточные строки input и output и построчное чтение файла;

все, что надо сделать, это определить #define PUT(c) if(c)putchar(c) #define GET() getchar() Напишите подобную функцию, удваивающую буквы в ссттррооккее.

7.27. Напишите программу, удаляющую из файла выделения. Для этого надо просто удалять последова тельности вида C\b #include #define NOPUT (-1) /* не символ ASCII */ /* Названия шрифтов - в перечислимом типе */ typedef enum { NORMAL=1, ITALICS, BOLD, RED=BOLD } font;

int ontty;

font textfont;

/* текущее выделение */ #define setfont(f) textfont=(f) #define getfont() (textfont) #define SetTtyFont(f) if(ontty) tfont(f) /* Установить выделение на экране терминала */ void tfont(font f){ /* только для ANSI терминала */ static font ttyfont = NORMAL;

if(ttyfont == f) return;

printf("\033[0m");

/* set NORMAL font */ switch(ttyfont = f){ case NORMAL: /* уже сделано выше */ break;

case BOLD: break;

printf("\033[1m");

case ITALICS: /* use reverse video */ break;

printf("\033[7m");

} } void put(int c){ /* Вывод символа текущим цветом */ if(c == NOPUT) return;

/* '\b' */ SetTtyFont(getfont());

putchar(c);

setfont(NORMAL);

/* Ожидать новой C\b посл-ти */ } void main(){ register int c, cprev = NOPUT;

/* Стандартный вывод - это терминал ? */ ontty = isatty(fileno(stdout));

setfont(NORMAL);

while((c = getchar()) != EOF){ if(c == '\b'){ /* выделение */ if((c = getchar()) == EOF) break;

if(c == cprev) setfont(BOLD);

else if(cprev == '_') setfont(ITALICS);

else /* наложение A\bB */ setfont(RED);

} else put(cprev);

cprev = c;

} put(cprev);

/* последняя буква файла */ SetTtyFont(NORMAL);

} 7.28. Напишите программу печати на принтере листинга Си-программ. Ключевые слова языка выделяйте двойной надпечаткой. Для выдачи на терминал напишите программу, подчеркивающую ключевые слова (подчеркивание - в следующей строке). Упрощение: выделяйте не ключевые слова, а большие буквы. Ука зание: для двойной печати используйте управляющий символ '\r' - возврат к началу той же строки;

затем А. Богатырёв, 1992-96 - 251 - Си в UNIX™ строка печатается повторно, при этом символы, которые не должны печататься жирно, следует заменить на пробелы (или на табуляцию, если этот символ сам есть '\t').

7.29. Напишите программу, печатающую тексты Си-программ на принтере. Выделяйте ключевые слова языка жирным шрифтом, строки "строка", символы 'c' и комментарии - курсивом. Шрифты для EPSON-FX совместимых принтеров (например EP-2424) переключаются такими управляющими последовательностями (ESC означает символ '\033'):

ВКЛЮЧЕНИЕ ВЫКЛЮЧЕНИЕ жирный шрифт (bold) ESC G ESC H утолщенный шрифт (emphasized) ESC E ESC F курсив (italics) ESC 4 ESC подчеркивание (underline) ESC - 1 ESC - повышенное качество печати ESC x 1 ESC x (near letter quality) nlq draft верхние индексы (superscript) ESC S 0 ESC T нижние индексы (subscript) ESC S 1 ESC T сжатый шрифт (17 букв/дюйм) '\017' '\022' (condensed) двойная ширина букв ESC W 1 ESC W (expanded) пропорциональная печать ESC p 1 ESC p (proportional spacing) Можно включить одновременно несколько из перечисленных выше режимов. В каждой из следующих двух групп надо выбрать одно из трех:

pitch (плотность печати) (10 букв/дюйм) pica ESC P elite (12 букв/дюйм) ESC M micron (15 букв/дюйм) ESC g font (шрифт) черновик (draft (Roman)) ESC k '\0' (text (Sans Serif)) текст ESC k '\1' (courier) курьер ESC k '\2' Всюду выше 0 означает либо '0' либо '\0';

1 означает либо '1' либо '\1'. Пример:

printf( "This is \033Gboldface\033H word\n");

7.30. Составьте программу вывода набора файлов на печать, начинающую каждый очередной файл с новой страницы и печатающую перед каждым файлом заголовок и номер текущей страницы. Используйте символ '\f' (form feed) для перевода листа принтера.

7.31. Напишите программу печати текста в две колонки. Используйте буфер для формирования листа:

файл читается построчно (слишком длинные строки обрубать), сначала заполняется левая половина листа (буфера), затем правая. Когда лист полностью заполнен или файл кончился - выдать лист построчно, распи сать буфер пробелами (очистить лист) и повторить заполнение очередного листа. Указание: размеры листа должны передаваться как аргументы main(), для буфера используйте двумерный массив букв, память для него заказывайте динамически. Усложнение: не обрубайте, а переносите слишком длинные строки (строка может потребовать даже переноса с листа на лист).

/* ПРОГРАММА ПЕЧАТИ В ДВЕ ПОЛОСЫ: pr.c */ #include #include #define YES #define NO #define FORMFEED '\f' #define LINEFEED '\n' extern char *malloc(unsigned);

extern char *strchr(char *, char);

void untab(register char *s);

void resetsheet( void );

void addsheet( char *s, FILE *fpout );

void flushsheet( FILE *fpout );

void printline( int y, char *s, char *attr, FILE *fpout );

А. Богатырёв, 1992-96 - 252 - Си в UNIX™ void doattr( register char *abuf, register char *vbuf );

void printcopy( FILE *fpin, FILE *fpout );

void main(void);

char *strdup (const char *s){ char *p = malloc(strlen(s)+1);

strcpy(p,s);

return p;

/* return strcpy((char *) malloc(strlen(s)+1), s);

*/ } /*... текст функции untab()... */ int Sline;

/* строка на листе */ int Shalf;

/* половина листа */ int npage;

/* номер страницы */ int startpage = 1;

/* печать начиная с 1ой страницы */ int fline;

/* номер строки файла */ int topline = 0;

/* смещение до начала листа */ int halfwidth;

/* ширина полулиста */ int twocolumns = YES;

/* в две колонки ? */ int lshift, rshift = 1;

/* поля слева и справа */ typedef unsigned short ushort;

int COLS = 128;

/* ширина листа (букв) */ int LINES = 66;

/* длина листа (строк) */ ushort *mem;

/* буфер листа */ #define AT(x,y) mem[ (x) + (y) * COLS ] /* Выделить буфер под лист и зачистить его */ void resetsheet ( void ){ register x;

if( mem == NULL ){ /* выделить память */ if ((mem = (ushort *) malloc (COLS * LINES * sizeof(ushort))) == NULL ){ fprintf(stderr, "Out of memory.\n");

exit(1);

} } /* очистить */ for( x= COLS * LINES - 1 ;

x >= 0 ;

x-- ) mem[x] = ' ' & 0xFF;

halfwidth = (twocolumns ? COLS/2 : COLS ) - (lshift + rshift );

Sline = topline;

Shalf = 0;

} #define NEXT_HALF \ if( twocolumns == YES && Shalf == 0 ){ \ /* закрыть данную половину листа */ \ Shalf = 1;

/* перейти к новой половине */ \ Sline = topline;

\ } else \ flushsheet(fpout) /* напечатать лист */ /* Записать строку в лист */ void addsheet ( char *s, FILE *fpout ) { register x, y;

register i;

char *rest = NULL;

int wrap = NO;

/* YES когда идет перенос слишком длинной строки */ /* в какое место поместить строку? */ x = (Shalf == 0 ? 0 : COLS/2) + lshift;

y = Sline;

А. Богатырёв, 1992-96 - 253 - Си в UNIX™ i = 0;

/* позиция в строке s */ while (*s) { if( *s == '\f' ){ /* вынужденный form feed */ rest = strdup( s+1 );

/* остаток строки */ NEXT_HALF;

if( *rest ) addsheet(rest, fpout);

free( rest );

return;

} if( i >= halfwidth ){ /* перенести длинную строку */ wrap = YES;

rest = strdup(s);

break;

} /* Обработка выделений текста */ if( s[1] == '\b' ){ while( s[1] == '\b' ){ AT(x, y) = (s[0] << 8) | (s[2] & 0xFF);

/* overstrike */ s += 2;

} s++;

x++;

i++;

} else { AT (x, y) = *s++ & 0xFF;

x++;

i++;

} } /* Увеличить строку/половину_листа */ Sline++;

if (Sline == LINES) { /* полулист заполнен */ NEXT_HALF;

} if( wrap && rest ) { /* дописать остаток строки */ addsheet(rest, fpout);

free(rest);

} } int again;

/* нужна ли повторная надпечатка? */ /* Напечатать заполненный лист */ void flushsheet ( FILE *fpout ){ register x, y, xlast;

char *s, *p;

static char outbuf[BUFSIZ], attr[BUFSIZ];

/* attr - буфер под атрибуты выделений */ ushort c;

if( npage >= startpage ) for (y = 0;

y < LINES;

y++) { /* обрезать концевые пробелы */ for (xlast = (-1), x = COLS - 1;

x >= 0;

x--) if (AT (x, y) != ' ') { xlast = x;

break;

} again = NO;

s = outbuf;

p = attr;

for (x = 0;

x <= xlast;

x++){ c = AT(x, y);

*s++ = c & 0xFF;

/* имеет атрибуты ? */ c >>= 8;

c &= 0xFF;

*p++ = c ? c : ' ';

if( c ) again = YES;

} *s = '\0';

*p = '\0';

printline(y, outbuf, attr, fpout);

} npage++;

/* next page */ resetsheet();

/* зачистить новый лист */ А. Богатырёв, 1992-96 - 254 - Си в UNIX™ } /* Напечатать одну строку листа */ void printline ( int y, char *s, char *attr, FILE *fpout ){ register x;

if( again ){ doattr(attr, s);

fprintf(fpout, "%s\r", attr );

} fprintf(fpout, "%s", s);

/* перевод листа или строки */ fputc( y == LINES-1 ? FORMFEED : LINEFEED, fpout );

} /* Проверить - нет ли атрибутов выделений */ void doattr ( register char *abuf, register char *vbuf ){ for(;

*abuf;

abuf++, vbuf++ ) if( !strchr(" _-!|\177", *abuf)) *abuf = *vbuf;

} /* Копирование файла на принтер */ void printcopy ( FILE *fpin, FILE *fpout ) { char inbuf[BUFSIZ];

npage = 1;

/* первая страница имеет номер 1 */ fline = 0;

/* текущая строка файла - 0 */ resetsheet();

/* зачистить буфер листа */ while( fgets(inbuf, sizeof inbuf - 1, fpin ) != NULL ){ register l = strlen( inbuf );

if( l && inbuf[l-1] == '\n' ) inbuf[--l] = '\0' ;

fline++;

untab ( inbuf );

addsheet( inbuf, fpout );

} if( !(Sline == topline && Shalf == 0)) /* если страница не была только что зачищена... */ flushsheet(fpout);

fprintf(stderr, "%d строк, %d листов.\n", fline, npage-1);

} /* Вызов: pr < файл > /dev/lp */ void main (){ printcopy(stdin, stdout);

} Файл-принтер имеет в UNIX имя /dev/lp или подобное ему, а в MS DOS - имя prn.

7.32. Напишите программу, которая построчно считывает небольшой файл в память и печатает строки в обратном порядке. Указание: используйте динамическую память - функции malloc() и strcpy().

Объясним, почему желательно пользоваться динамической памятью. Пусть мы знаем, что строки имеют максимальную длину 80 символов и максимальное количество строк равно 50. Мы могли бы хранить текст в двумерном массиве:

char text[50][80];

занимающем 50*80 = 4000 байт памяти. Пусть теперь оказалось, что строки файла в действительности имеют длину по 10 букв. Мы используем 50 * (10 + 1) = 550 байт не используем 4000 - 50 * (10 + 1) = 3450 байт (+1 нужен для символа '\0' на конце строки).

Пусть мы теперь пишем А. Богатырёв, 1992-96 - 255 - Си в UNIX™ char *text[50];

int i=0;

и при чтении очередной строки сохраняем ее так:

char buffer[81], *malloc(), *gets();

while( gets(buffer) != NULL ){ text[i] = (char *) malloc(strlen(buffer)+1);

/* +1 для хранения \0, который не учтен strlen-ом */ strcpy(text[i++], buffer);

} то есть заказываем ровно столько памяти, сколько надо для хранения строки и ни байтом больше. Здесь мы (если sizeof(char *)==4) используем 50 * 4 + 50 * (10 + 1 + 4) = 950 байт массив указателей + заказанная malloc память (+4 - служебная информация malloc), но зато у нас не остается неиспользуемой памяти. Преимуществом выделения памяти в виде массива является то, что эта память выделится ГАРАНТИРОВАННО, тогда как malloc()-у может не хватить памяти (если мы ее прежде очень много захватывали и не освобождали free()).

Если malloc не может выделить участок памяти требуемого размера, он возвращает значение NULL:

if((text[i] = malloc(....)) == NULL) { fprintf(stderr, "Мало памяти\n");

break;

} Распечатка строк:

for(--i;

i >= 0;

i-- ){ printf("%s\n", text[i]);

free( text[i] );

} Функция free(ptr) "освобождает"† отведенную ранее malloc()ом или calloc()ом область памяти по адресу ptr так, что при новых вызовах malloc() эта область может быть переиспользована. Данные в освобожден ной памяти ПОРТЯТСЯ после free(). Ошибочно (и опасно) освобождать память, которая НЕ БЫЛА отведена malloc()-ом!

Организация текста в виде массива ссылок на строки или списка ссылок на строки, а не в виде дву мерного текстового поля, выгодна еще тем, что такие строки проще переставлять, сортировать, вставлять строку в текст, удалять строку из текста. При этом переставляются лишь указатели в линейном массиве, а сами строки никуда не копируются. В двумерном же байтовом массиве нам пришлось бы для тех же пере становок копировать целые массивы байт - строки этой текстовой матрицы.

7.33. Напишите программу, печатающую строки файла в обратном порядке. Не считывать файл целиком в память! Следует использовать метод "обратного чтения" либо метод "быстрого доступа" к строкам файла, описанный в главе "Работа с файлами".

† На самом деле все освобожденные куски включаются в список свободной памяти, и склеиваются вместе, если два освобожденных куска оказались рядом. При новых вызовах malloc сначала просматрива ется список свободной памяти - нет ли там области достаточного размера? Этот алгоритм описан у Керни гана и Ритчи.

А. Богатырёв, 1992-96 - 256 - Си в UNIX™ /* Инвертирование порядка строк в файле.

* Используется та идея, что файл-результат имеет тот же * размер, что и исходный */ #include #include #include #define BUFS 4096 /* максимальная длина строки */ void main(int argc, char **argv ) { FILE *fp;

struct stat st;

long len;

char buffer[ BUFS+1 ];

FILE *fpnew;

/* инверсный файл */ int lgt;

if( argc != 2 ){ printf("Error: must be filename\n");

exit(1);

} if( (fp= fopen( argv[1], "r" )) == NULL ){ printf( "Can not open %s\n", argv[1] );

exit(2);

} stat( argv[1], &st );

/* fstat(fileno(fp), &st);

*/ len = st.st_size;

/* длина файла в байтах */ if( (fpnew = fopen( "inv.out", "w" ))== NULL ){ printf("Can not create file\n");

exit(3);

} while( fgets( buffer, sizeof buffer, fp ) != NULL ){ lgt = strlen( buffer );

fseek(fpnew, len - lgt, 0);

/* Помните, что смещение у lseek и fseek * это число типа long, а не int.

* Поэтому лучше всегда писать * lseek(fd, (long) off, whence);

*/ len -= lgt;

fprintf( fpnew, "%s", buffer );

/* или лучше fputs(buffer, fpnew);

*/ } fclose( fp );

fclose( fpnew );

} 7.34. Напишите программу, которая читает файл, состоящий из "блоков" текста, разделенных пустыми строками. Размер "блока" ограничен. Программа готовит файл для печати на принтер так, чтобы ни один блок не разбивался на части:

----------- ---------- |###### A | |###### A | лист |#### A | превращать |#### A| |##### A | в |##### A | | | | | |###### B | | | ----------- ---------- |#### B| |###### B | лист | | |#### B|... | | то есть если блок не умещается на остатке листа, он должен быть перенесен на следующий лист. Блоки следует разделять одной пустой строкой (но первая строка листа не должна быть пустой!). Если блок А. Богатырёв, 1992-96 - 257 - Си в UNIX™ длиннее страницы - не переносите его.

/* Решение задачи о переносе блоков текста, * если они не умещаются на остатке листа */ #include #include extern void *malloc(unsigned);

extern int atoi(char *);

FILE *fpin = stdin, *fpout = stdout;

/* Спасти строку в динамически выделенной памяти */ char *strdup (const char *s) { char *ptr = (char *) malloc (strlen (s) + 1);

if( ptr ) strcpy (ptr, s);

return ptr;

} int page_length = 66;

/* длина страницы */ int current_line;

/* текущая строка на странице (с нуля) */ int numbered = 0;

/* нумеровать строки листа ? */ #define MAXLINES 256 /* макс. длина блока */ int stored = 0;

/* запомнено строк */ char *lines[MAXLINES];

/* запомненные строки */ /* Запомнить строку блока в буфер строк */ void remember (char *s) { if (stored >= MAXLINES) { fprintf (stderr, "Слишком длинный блок.\n");

return;

} else if((lines[stored++] = strdup (s)) == NULL ){ fprintf (stderr, "Мало памяти (Out of memory).\n");

exit(13);

} } /* Переход на следующую страницу */ void newpage () { current_line = 0;

putc('\f', fpout);

} /* Перевод строки или листа */ void newline (void) { if (current_line == page_length - 1) newpage ();

/* начать новый лист */ else { current_line++;

if( numbered ) fprintf(fpout, "%02d\n", current_line);

else putc ('\n', fpout);

} } /* Переход на следующую страницу вставкой пустых строк */ void nextpage () { while (current_line != 0) newline ();

} /* Выдать спасенный блок */ void throwout () { register i;

for (i = 0;

i < stored;

i++) { if( numbered ) fprintf(fpout, "%02d %s", current_line, lines[i]);

else fputs (lines[i], fpout);

newline ();

free (lines[i]);

} stored = 0;

} А. Богатырёв, 1992-96 - 258 - Си в UNIX™ /* Выдать блок, перенося на следующий лист если надо */ void flush () { int rest_of_page = page_length - current_line;

/* осталось пустых строк на странице */ if ((stored > page_length && rest_of_page < page_length / 4) || rest_of_page < stored) nextpage ();

throwout ();

if (current_line) /* не первая строка листа */ newline ();

/* разделитель блоков */ } /* Обработать входной файл */ void process () { char buffer[512];

int l;

while (fgets (buffer, sizeof buffer, fpin) != NULL) { if ((l = strlen (buffer)) && buffer[l - 1] == '\n') buffer[ --l] = '\0';

if (l) remember (buffer);

/* а по пустой строке - выдать блок */ else if (stored) flush ();

} if (stored) flush ();

nextpage();

} void main (int argc, char *argv[]) { argc--;

argv++;

while (*argv) { if (**argv == '-') { char *key = *argv + 1, *arg;

switch (*key) { case 'l':

if (! key[1]) { if( argv[1] ){ arg = argv[1];

argv++;

argc--;

} else arg = "";

} else arg = key+1;

if( isdigit(*arg) ){ page_length = atoi(arg);

fprintf (stderr, "Длина страницы: %d строк\n", page_length);

} else fprintf(stderr, "-l ЧИСЛО\n");

break;

case 'n':

numbered++;

break;

default:

fprintf (stderr, "Неизвестный ключ %s\n", key);

break;

} } argv++;

argc--;

} process ();

exit(0);

} 7.35. Составьте программу вывода строк файла в инверсном отображении, причем порядок символов в строках также следует инвертировать. Например, abcdef... oklmn..... превращать в.....

123456789 nmlko... fedcba Программа должна быть составлена двумя способами: при помощи обратного чтения файла и рекурсивным вызовом самой функции инвертирования. Указание: при обратном чтении надо читать файл большими А. Богатырёв, 1992-96 - 259 - Си в UNIX™ кусками (блоками).

7.36. Напишите программу, читающую файл построчно и размещающую строки в отсортированное двоич ное дерево. По концу файла - распечатайте это дерево. Указание: используйте динамическую память и рекурсию.

/* Двоичная сортировка строк при помощи дерева */ #include char buf[240];

/* буфер ввода */ int lines;

/* номер строки файла */ typedef struct node{ struct _data{ /* ДАННЫЕ */ char *key;

/* ключ - строка */ int line;

/* номер строки */ } data;

/* СЛУЖЕБНАЯ ИНФОРМАЦИЯ */ struct node *l, /* левое поддерево */ *r;

/* правое поддерево */ } Node;

Node *root = NULL;

/* корень дерева (ссылка на верхний узел) */ /* Отведение памяти и инициализация нового узла */ Node *newNode(s) char *s;

/* строка */ { Node *tmp;

extern char *malloc();

/* выделитель памяти */ tmp = (Node *) malloc(sizeof(Node));

if( tmp == NULL ){ fprintf( stderr, "Нет памяти.\n");

exit(1);

} tmp -> l = tmp -> r = NULL;

/* нет поддеревьев */ tmp -> data.line = lines;

/* номер строки файла */ tmp -> data.key = malloc( strlen(s) + 1 );

/* +1 - под байт '\0' в конце строки */ strcpy(tmp -> data.key, s);

/* копируем ключ в узел */ return tmp;

} int i;

/* Вынесено в статическую память, чтобы при каждом * рекурсивном вызове не создавалась новая auto-переменная, * а использовалась одна и та же статическая */ А. Богатырёв, 1992-96 - 260 - Си в UNIX™ /* Рекурсивная печать дерева */ void printtree(root, tree, level, c) Node *root;

/* корень дерева */ Node *tree;

/* дерево */ int level;

/* уровень */ char c;

/* имя поддерева */ { if( root == NULL ){ printf("Дерево пусто.\n");

return;

} if( tree == NULL ) return;

/* если есть - распечатать левое поддерево */ printtree (root, tree -> l, level + 1, '/');

/* 'L' */ /* распечатать ключ узла */ for( i=0;

i < level;

i++ ) printf(" ");

printf("%c%3d--\"%s\"\n", c, tree-> data.line, tree -> data.key);

/* если есть - распечатать правое поддерево */ printtree(root, tree -> r, level + 1, '\\');

/* 'R' */ } void prTree(tree) Node *tree;

{ printtree(tree, tree, 0, '*');

} /* Добавить узел с ключом key в дерево tree */ void addnode(tree, key) Node **tree;

/* в какое дерево добавлять: адрес переменной, * содержащей ссылку на корневой узел */ char *key;

/* ключ узла */ { #define TREE (*tree) if( TREE == NULL ){ /* дерево пока пусто */ TREE = newNode( key );

return;

} /* иначе есть хоть один узел */ if ( strcmp (key, TREE -> data.key) < 0 ) { /* добавить в левое поддерево */ if ( TREE -> l == NULL ){ /* нет левого дерева */ TREE -> l = newNode(key);

return;

} else addnode( & TREE ->l, key);

} else{ /* добавить в правое дерево */ if ( TREE -> r == NULL ){ /* нет правого поддерева */ TREE -> r = newNode(key);

return;

} else addnode ( & TREE ->r, key) ;

} } А. Богатырёв, 1992-96 - 261 - Си в UNIX™ /* Процедура удаления из дерева по ключу. */ typedef struct node *NodePtr;

static NodePtr delNode;

/* удаляемая вершина */ void delete(key, tree) char *key;

/* ключ удаляемого элемента */ NodePtr *tree;

/* из какого дерева удалять */ { extern void doDelete();

if(*tree == NULL){ printf( "%s не найдено\n", key );

return;

} /* поиск ключа */ else if(strcmp(key, (*tree)->data.key) < 0) delete( key, &(*tree)->l );

else if(strcmp(key, (*tree)->data.key) > 0) delete( key, &(*tree)->r );

else{ /* ключ найден */ delNode = *tree;

/* указатель на удаляемый узел */ if(delNode->r == NULL) *tree = delNode->l;

else if(delNode->l == NULL) *tree = delNode->r;

else doDelete( & delNode->l );

free(delNode);

} } static void doDelete(rt) NodePtr *rt;

{ if( (*rt)->r != NULL ) /* спуск по правой ветви */ doDelete( &(*rt)->r );

else{ /* перенос данных в другой узел */ delNode->data = (*rt)->data;

delNode = *rt;

/* для free() */ *rt = (*rt)->l;

} } void main(){ extern char *gets();

char *s;

while (gets(buf) != NULL){ /* пока не конец файла */ lines++;

addnode( & root, buf );

} prTree(root);

/* удалим строку */ freopen("/dev/tty", "r", stdin);

do{ printf( "что удалить ? " );

if((s = gets(buf)) == NULL) break;

delete(buf, &root);

prTree( root );

} while( s && root );

printf("Bye-bye.\n");

exit(0);

} 7.37. Напишите программу, которая читает со стандартного ввода 10 чисел либо слов, а затем распечаты вает их. Для хранения введенных данных используйте объединение.

#include #include #define INT 'i' А. Богатырёв, 1992-96 - 262 - Си в UNIX™ #define STR 's' struct data { char tag;

/* тэг, пометка. Код типа данных. */ union { int i;

char *s;

} value;

} a[10];

int counter = 0;

/* счетчик */ void main(){ char word[128];

int i;

char *malloc(unsigned);

/* Чтение: */ for(counter=0;

counter < 10;

counter++){ if( gets(word) == NULL ) break;

if( isdigit((unsigned char) *word)){ a[counter].value.i = atoi(word);

a[counter].tag = INT;

} else { a[counter].value.s = malloc(strlen(word)+1);

strcpy(a[counter].value.s, word);

a[counter].tag = STR;

} } /* Распечатка: */ for(i=0;

i < counter;

i++) switch(a[i].tag){ case INT: printf("число %d\n", a[i].value.i);

break;

case STR: printf("слово %s\n", a[i].value.s);

free(a[i].value.s);

break;

} } 7.38. Рассмотрим задачу написания функции, которая обрабатывает переменное число аргументов, напри мер функцию-генератор меню. В такую функцию надо подавать строки меню и адреса функций, вызывае мых при выборе каждой из строк. Собственно проблема, которую мы тут обсуждаем - как передавать пере менное число аргументов в подобные функции? Мы приведем три программы использующие три различных подхода. Предпочтение не отдано ни одному из них - каждый из них может оказаться эффективнее других в определенных ситуациях. Думайте сами!

7.38.1. Массив /* Передача аргументов в функцию как МАССИВА.

* Следует явно указать число аргументов в массиве.

*/ #include /* printf(), NULL */ #include /* strdup() */ #include /* malloc() */ #define A_INT #define A_STR #define A_NULL typedef struct arg { int type;

union jack { char *s;

int d;

} data;

struct arg *next;

} Arg;

А. Богатырёв, 1992-96 - 263 - Си в UNIX™ void doit(Arg args[], int n){ int i;

for(i=0;

i < n;

i++) switch(args[i].type){ case A_INT:

printf("%d", args[i].data.d);

break;

case A_STR:

printf("%s", args[i].data.s);

break;

default:

fprintf(stderr, "Unknown type!\n");

break;

} } /* При инициализации union надо использовать тип * первого из перечисленных значений.

*/ Arg sample[] = { { A_INT, (char *) 123 }, { A_STR, (char *) " hello, " }, { A_INT, (char *) 456 }, { A_STR, (char *) " world\n" } };

int main(int ac, char *av[]){ doit(sample, sizeof sample / sizeof sample[0]);

return 0;

} 7.38.2. Список /* Передача аргументов в функцию как СПИСКА.

* Достоинство: список можно модифицировать * во время выполнения программы: добавлять и * удалять элементы. Недостаток тот же: список надо * построить динамически во время выполнения, * заранее этого сделать нельзя.

* Недостатком данной программы является также то, * что список не уничтожается после использования.

* В C++ эта проблема решается при помощи использования * автоматически вызываемых деструкторов.

*/ #include /* printf(), NULL */ #include /* strdup() */ #include /* malloc() */ #define A_INT #define A_STR #define A_NULL typedef struct arg { int type;

union jack { char *s;

int d;

} data;

struct arg *next;

} Arg;

А. Богатырёв, 1992-96 - 264 - Си в UNIX™ void doit(Arg *arglist){ for( ;

arglist;

arglist=arglist->next) switch(arglist->type){ case A_INT:

printf("%d", arglist->data.d);

break;

case A_STR:

printf("%s", arglist->data.s);

break;

default:

fprintf(stderr, "Unknown type!\n");

break;

} } Arg *new_int(int n, Arg *next){ Arg *ptr = (Arg *) malloc(sizeof(Arg));

ptr->type = A_INT;

ptr->data.d = n;

ptr->next = next;

return ptr;

} Arg *new_str(char *s, Arg *next){ Arg *ptr = (Arg *) malloc(sizeof(Arg));

ptr->type = A_STR;

ptr->data.s = strdup(s);

ptr->next = next;

return ptr;

} int main(int ac, char *av[]){ doit( new_int(123, new_str(" hello, ", new_int(456, new_str(" world\n", NULL)))) );

return 0;

} 7.38.3. Функция с переменным числом параметров /* Передача аргументов в функцию как СПИСКА АРГУМЕНТОВ * ФУНКЦИИ с признаком конца списка.

*/ #include /* printf(), NULL */ #include /* va_... */ #define A_INT #define A_STR #define A_NULL А. Богатырёв, 1992-96 - 265 - Си в UNIX™ void doit(...){ /* переменное число аргументов */ va_list args;

/* второй параметр - аргумент, предшествующий...

* Если такого нет - ставим запятую и пустое место!

*/ va_start(args, );

for(;

;

){ switch(va_arg(args, int)){ case A_INT:

printf("%d", va_arg(args, int));

break;

case A_STR:

printf("%s", va_arg(args, char *));

break;

case A_NULL:

goto breakloop;

default:

fprintf(stderr, "Unknown type!\n");

break;

} } breakloop:

va_end(args);

} int main(int ac, char *av[]){ doit( A_INT, 123, A_STR, " hello, ", A_INT, 456, A_STR, " world\n", A_NULL );

return 0;

} 7.39. Напишите несколько функций для работы с упрощенной базой данных. Запись в базе данных содер жит ключ - целое, и строку фиксированной длины:

struct data { int b_key;

/* ключ */ char b_data[ DATALEN ];

/* информация */ };

Напишите:

• добавление записи • уничтожение по ключу • поиск по ключу (и печать строки) • обновление по ключу.

Файл организован как несортированный массив записей без дубликатов (т.е. ключи не могут повторяться).

Поиск производить линейно. Используйте функции fread, fwrite, fseek. Последняя функция позволяет вам позиционироваться к n-ой записи файла:

fseek( fp, (long) n * sizeof(struct data), 0 );

Перепишите эту программу, объявив ключ как строку, например char b_key[ KEYLEN ];

Если строка-ключ короче KEYLEN символов, она должна оканчиваться '\0', иначе - используются все KEYLEN букв и '\0' на конце отсутствует (так же устроено поле d_name в каталогах файловой системы). Усовершен ствуйте алгоритм доступа, используя хеширование по ключу (hash - перемешивание, см. пример в приложе нии). Вынесите ключи в отдельный файл. Этот файл ключей состоит из структур А. Богатырёв, 1992-96 - 266 - Си в UNIX™ struct record_header { int ;

/* ключ */ b_key long /* адрес записи в файле данных */ b_offset;

int /* длина записи (необязательно) */ b_length;

};

то есть организован аналогично нашей первой базе данных. Сначала вы ищете нужный ключ в файле клю чей. Поле b_offset у найденного ключа задает адрес данного в другом файле. Чтобы прочитать его, надо сделать fseek на расстояние b_offset в файле данных и прочесть b_length байт.

7.40. Организуйте базу данных в файле как список записей. В каждой записи вместо ключа должен хра ниться номер очередной записи (ссылка). Напишите функции: поиска данных в списке (по значению), доба вления данных в список в алфавитном порядке, (они просто приписываются к концу файла, но в нужных местах переставляются ссылки), распечатки списка в порядке ссылок, удалению элементов из списка (из самого файла они не удаляются!). Ссылка (номер) первой записи (головы списка) хранится в первых двух байтах файла, рассматриваемых как short.

Введите оптимизацию: напишите функцию для сортировки файла (превращению перемешанного списка в линейный) и вычеркивания из него удаленных записей. При этом файл будет перезаписан. Если файл отсортирован, то поиск в нем можно производить более эффективно, чем прослеживание цепочки ссылок: просто линейным просмотром. Третий байт файла используйте как признак: 1 - файл был отсорти рован, 0 - после сортировки в него было что-то добавлено и линейный порядок нарушен.

7.41. Напишите функцию match(строка,шаблон);

для проверки соответствия строки упрощенному регуляр ному выражению в стиле Шелл. Метасимволы шаблона:

* - любое число любых символов (0 и более);

? - один любой символ.

Усложнение:

[буквы] - любая из перечисленных букв.

[!буквы] - любая из букв, кроме перечисленных.

[h-z] - любая из букв от h до z включительно.

Указание: для проверки "остатка" строки используйте рекурсивный вызов этой же функции.

Используя эту функцию, напишите программу, которая выделяет из файла СЛОВА, удовлетворяющие заданному шаблону (например, "[Ии]*о*т"). Имеется в виду, что каждую строку надо сначала разбить на слова, а потом проверить каждое слово.

А. Богатырёв, 1992-96 - 267 - Си в UNIX™ #include #include #include #define U(c) ((c) & 0377) /* подавление расширения знака */ #define QUOT '\\' /* экранирующий символ */ #ifndef MATCH_ERR # define MATCH_ERR printf("Нет ]\n") #endif /* s - сопоставляемая строка * p - шаблон. Символ \ отменяет спецзначение метасимвола.

*/ int match (register char *s, register char *p) { register int scc;

/* текущий символ строки */ /* lc - предыдущий символ в [...] списке */ int c, cc, lc;

int ok, notflag;

for (;

;

) { scc = U(*s++);

/* очередной символ строки */ switch (c = U (*p++)) { /* очередной символ шаблона */ case QUOT: /* a*\*b */ c = U (*p++);

if( c == 0 ) return(0);

/* ошибка: pattern\ */ else goto def;

case '[': /* любой символ из списка */ ok = notflag = 0;

lc = 077777;

/* достаточно большое число */ if(*p == '!'){ notflag=1;

p++;

} while (cc = U (*p++)) { if (cc == ']') { /* конец перечисления */ if (ok) break;

/* сопоставилось */ return (0);

/* не сопоставилось */ } if (cc == '-') { /* интервал символов */ if (notflag){ /* не из диапазона - OK */ if (!syinsy (lc, scc, U (*p++))) ok++;

/* из диапазона - неудача */ else return (0);

} else { /* символ из диапазона - OK */ if (syinsy (lc, scc, U (*p++))) ok++;

} } else { /* [\[\]] */ if (cc == QUOT){ cc = U(*p++);

if(!cc) return(0);

/* ошибка */ } if (notflag){ if (scc && scc != (lc = cc)) ok++;

/* не входит в список */ else return (0);

} else { if (scc == (lc = cc)) /* входит в список */ ok++;

} } } А. Богатырёв, 1992-96 - 268 - Си в UNIX™ if (cc == 0){ /* конец строки */ MATCH_ERR;

return (0);

/* ошибка */ } continue;

case '*': /* любое число любых символов */ if (!*p) return (1);

for (s--;

*s;

s++) if (match (s, p)) return (1);

return (0);

case 0:

return (scc == 0);

default: def:

if (c != scc) return (0);

continue;

case '?': /* один любой символ */ if (scc == 0) return (0);

continue;

} } } /* Проверить, что smy лежит между smax и smin */ int syinsy (unsigned smin, unsigned smy, unsigned smax) { [2];

char left char right [2];

char middle [2];

left [0] left [1] = smin;

= '\0';

right [0] right [1] = smax;

= '\0';

middle[0] = smy;

middle[1] = '\0';

return (strcoll(left, middle) <= 0 && strcoll(middle, right) <= 0);

} Обратите внимание на то, что в UNIX расширением шаблонов имен файлов, вроде *.c, занимается не опе рационная система (как в MS DOS), а программа-интерпретатор команд пользователя (shell: /bin/sh, /bin/csh, /bin/ksh). Это позволяет обрабатывать (в принципе) разные стили шаблонов имен.

7.42. Изучите раздел руководства man regexp и include-файл /usr/include/regexp.h, содержащий исходные тексты функций compile и step для регулярного выражения в стиле программ ed, lex, grep:

одна буква C или заэкранированный спецсимвол \. \[ \* \$ \^ \\ означают сами себя;

. означает один любой символ кроме \n;

[abc] или [a-b] означает любой символ из перечисленных (из интервала);

[abc-] минус в конце означает сам символ -;

[]abc] внутри [] скобка ] на первом месте означает сама себя;

[^a-z] крышка ^ означает отрицание, т.е. любой символ кроме перечисленных;

[a-z^] крышка не на первом месте означает сама себя;

[\*.] спецсимволы внутри [] не несут специального значения, а представляют сами себя;

C* любое (0 и более) число символов C;

А. Богатырёв, 1992-96 - 269 - Си в UNIX™.* любое число любых символов;

выражение* любое число (0 и более) повторений выражения, например [0-9]* означает число (последователь ность цифр) или пустое место. Ищется самое длинное прижатое влево подвыражение;

выражение\{n,m\} повторение выражения от n до m раз (включительно), где числа не превосходят 255;

выражение\{n,\} повторение по крайней мере n раз, например [0-9]\{1,\} означает число;

выражение\{n\} повторение ровно n раз;

выражение$ строка, чей конец удовлетворяет выражению, например.*define.*\\$ ^выражение строка, чье начало удовлетворяет выражению;

\n символ перевода строки;

\(.....\) сегмент. Сопоставившаяся с ним подстрока будет запомнена;

\N где N цифра. Данный участок образца должен совпадать с N-ым сегментом (нумерация с 1).

Напишите функцию matchReg, использующую этот стиль регулярных выражений. Сохраняйте шаблон, при вызове matchReg сравнивайте старый шаблон с новым. Перекомпиляцию следует производить только если шаблон изменился:

#include #include #define INIT register char *sp = instring;

#define GETC() (*sp++) #define PEEKC() (*sp) #define UNGETC(c) (--sp) #define RETURN(ptr) return #define ERROR(code) \ {fprintf(stderr,"%s:ERR%d\n",instring,code);

exit(177);

} # include #define EOL '\0' /* end of line */ #define ESIZE int matchReg(char *str, char *pattern){ static char oldPattern[256];

static char compiledExpr[ESIZE];

if( strcmp(pattern, oldPattern)){ /* различны */ /* compile regular expression */ compile(pattern, compiledExpr, &compiledExpr[ESIZE], EOL);

strcpy(oldPattern, pattern);

/* запомнить */ } return step(str, compiledExpr);

/* сопоставить */ } /* Пример вызова: reg '^int' 'int$' char | less */ /* reg 'putchar.*(.*)' < reg.c | more */ void main(int ac, char **av){ char inputline[BUFSIZ];

register i;

while(gets(inputline)){ for(i=1;

i < ac;

i++) if(matchReg(inputline, av[i])){ char *p;

extern char *loc1, *loc2;

/*printf("%s\n", inputline);

*/ /* Напечатать строку, А. Богатырёв, 1992-96 - 270 - Си в UNIX™ * выделяя сопоставившуюся часть жирно */ for(p=inputline;

p != loc1;

p++) putchar(*p);

for( ;

p != loc2;

p++) if(isspace((unsigned char) *p)) putchar(*p);

else printf("%c\b%c", *p, *p);

for( ;

*p;

p++) putchar(*p);

putchar('\n');

break;

} } } 7.43. Используя напишите программу, производящую контекстную замену во всех строках файла. Если строка не удовлетворяет регулярному выражению - она остается неизменной. Примеры вызова:

$ regsub '\([0-9]\{1,\}\)' '(\1)' $ regsub 'f(\(.*\),\(.*\))' 'f(\2,\1)' < file Вторая команда должна заменять все вхождения f(a,b) на f(b,a). Выражение, обозначенное в образце как \(...\), подставляется на место соответствующей конструкции \N во втором аргументе, где N - цифра, номер сегмента. Чтобы поместить в выход сам символ \, его надо удваивать: \\.

/* Контекстная замена */ #include #include #define INIT register char *sp = instring;

#define GETC() (*sp++) #define PEEKC() (*sp) #define UNGETC(c) (--sp) #define RETURN(ptr) return #define ERROR(code) regerr(code) void regerr();

# include #define EOL '\0' /* end of line */ #define ESIZE short all = 0;

/* ключ -a означает, что в строке надо заменить ВСЕ вхождения образца (global, all):

* regsub -a int INT * "aa int bbb int cccc" -> "aa INT bbb INT cccc" * * step() находит САМУЮ ДЛИННУЮ подстроку, удовлетворяющую выражению, * поэтому regsub 'f(\(.*\),\(.*\))' 'f(\2,\1)' * заменит "aa f(1,2) bb f(3,4) cc" -> "aa f(4,1,2) bb f(3) cc' * |_|_| |_|_| */ char compiled[ESIZE], line[512];

А. Богатырёв, 1992-96 - 271 - Си в UNIX™ void main(int ac, char *av[]){ register char *s, *p;

register n;

extern int nbra;

extern char *braslist[], *braelist[], *loc1, *loc2;

if( ac > 1 && !strcmp(av[1], "-a")){ ac--;

av++;

all++;

} if(ac != 3){ fprintf(stderr, "Usage: %s [-a] pattern subst\n", av[0]);

exit(1);

} compile(av[1], compiled, compiled + sizeof compiled, EOL);

while( gets(line) != NULL ){ if( !step(s = line, compiled)){ printf("%s\n", line);

continue;

} do{ /* Печатаем начало строки */ for( ;

s != loc1;

s++) putchar(*s);

/* Делаем замену */ for(s=av[2];

*s;

s++) if(*s == '\\'){ if(isdigit(s[1])){ /* сегмент */ int num = *++s - '1';

if(num < 0 || num >= nbra){ fprintf(stderr, "Bad block number %d\n", num+1);

exit(2);

} for(p=braslist[num];

p != braelist[num];

++p) putchar(*p);

} else if(s[1] == '&'){ ++s;

/* вся сопоставленная строка */ for(p=loc1;

p != loc2;

++p) putchar(*p);

} else putchar(*++s);

} else putchar(*s);

} while(all && step(s = loc2, compiled));

/* Остаток строки */ for(s=loc2;

*s;

s++) putchar(*s);

putchar('\n');

} /* endwhile */ } void regerr(int code){ char *msg;

switch(code){ case 11: msg = "Range endpoint too large.";

break;

case 16: msg = "Bad number.";

break;

case 25: msg = "\\digit out of range.";

break;

case 36: msg = "Illegal or missing delimiter.";

break;

case 41: msg = "No remembered search string.";

break;

case 42: msg = "\\(~\\) imbalance.";

break;

case 43: msg = "Too many \\(.";

break;

case 44: msg = "More than 2 numbers given in \\{~\\\"}.";

break;

case 45: msg = "} expected after \\.";

break;

case 46: msg = "First number exceeds second in \\{~\\}.";

break;

case 49: msg = "[ ] imbalance.";

break;

case 50: msg = "Regular expression overflow.";

break;

default: msg = "Unknown error";

break;

} fputs(msg, stderr);

fputc('\n', stderr);

exit(code);

} А. Богатырёв, 1992-96 - 272 - Си в UNIX™ void prfields(){ int i;

for(i=0;

i < nbra;

i++) prfield(i);

} void prfield(int n){ char *fbeg = braslist[n], *fend = braelist[n];

printf("\\%d='", n+1);

for(;

fbeg != fend;

fbeg++) putchar(*fbeg);

printf("'\n");

} 7.44. Составьте функцию поиска подстроки в строке. Используя ее, напишите программу поиска под строки в текстовом файле. Программа должна выводить строки (либо номера строк) файла, в которых встретилась данная подстрока. Подстрока задается в качестве аргумента функции main().

/* Алгоритм быстрого поиска подстроки.

* Дж. Мур, Р. Бойер, 1976 Texas * Смотри: Communications of the ACM 20, 10 (Oct., 1977), 762- * * Этот алгоритм выгоден при многократном поиске образца в * большом количестве строк, причем если они равной длины * можно сэкономить еще и на операции strlen(str).

* Алгоритм характерен тем, что при неудаче производит сдвиг не на * один, а сразу на несколько символов вправо.

* В лучшем случае алгоритм делает slen/plen сравнений.

*/ char *pattern;

/* образец (что искать) */ static int plen;

/* длина образца */ static int d[256];

/* таблица сдвигов;

в алфавите ASCII * 256 букв. */ /* расстояние от конца образца до позиции i в нем */ #define DISTANCE(i) ((plen-1) - (i)) А. Богатырёв, 1992-96 - 273 - Си в UNIX™ /* Поиск:

* выдать индекс вхождения pattern в str, * либо -1, если не входит */ int indexBM( str ) char *str;

/* в чем искать */ { int slen = strlen(str);

/* длина строки */ register int pindx;

/* индекс сравниваемой буквы в образце */ register int cmppos;

/* индекс сравниваемой буквы в строке */ register int endpos;

/* позиция в строке, к которой "приставляется" * последняя буква образца */ /* пока образец помещается в остаток строки */ for( endpos = plen-1;

endpos < slen ;

){ /* Для отладки: pr(str, pattern, endpos - (plen-1), 0);

/**/ /* просмотр образца от конца к началу */ for( cmppos = endpos, pindx = (plen - 1);

pindx >= 0 ;

cmppos--, pindx-- ) if( str[cmppos] != pattern[pindx] ){ /* Сдвиг, который ставит самый правый в образце * символ str[endpos] как раз под endpos-тую * позицию строки. Если же такой символ в образце не * содержится (или содержится только на конце), * то начало образца устанавливается в endpos+1 ую * позицию */ endpos += d[ str[endpos] & 0377 ];

break;

/* & 0377 подавляет расширение знака. Еще */ } /* можно сделать все char -> unsigned char */ if( pindx < 0 ) return ( endpos - (plen-1));

/* Нашел: весь образец вложился */ } return( -1 );

/* Не найдено */ } /* Разметка таблицы сдвигов */ void compilePatternBM( ptrn ) char *ptrn;

{ register int c;

pattern = ptrn;

plen = strlen(ptrn);

/* c - номер буквы алфавита */ for(c = 0;

c < 256;

c++) d[c] = plen;

/* сдвиг на длину всего образца */ /* c - позиция в образце */ for(c = 0;

c < plen - 1;

c++) d[ pattern[c] & 0377 ] = DISTANCE(c);

/* Сдвиг равен расстоянию от самого правого * (кроме последней буквы образца) * вхождения буквы в образец до конца образца.

* Заметим, что если буква входит в образец несколько раз, * то цикл учитывает последнее (самое правое) вхождение.

*/ } А. Богатырёв, 1992-96 - 274 - Си в UNIX™ /* Печать найденных строк */ void pr(s, p, n, nl) char *s, *p;

{ register i;

printf("%4d\t%s\n", nl, s );

printf(" \t");

for(i = 0;

i < n;

i++ ) putchar( s[i] == '\t' ? '\t' : ' ' );

printf( "%s\n", p );

} /* Аналог программы fgrep */ #include char str[ 1024 ];

/* буфер для прочитанной строки */ void main(ac, av) char **av;

{ int nline = 0;

/* номер строки файла */ int ind;

int retcode = 1;

if(ac != 2){ fprintf(stderr, "Usage: %s 'pattern'\n", av[0] );

exit(33);

} compilePatternBM( av[1] );

while( gets(str) != NULL ){ nline++;

if((ind = indexBM(str)) >= 0 ){ retcode = 0;

/* O'KAY */ pr(str, pattern, ind, nline);

} } exit(retcode);

} /* Пример работы алгоритма:

peter piper picked a peck of pickled peppers.

peck peter piper picked a peck of pickled peppers.

peck peter piper picked a peck of pickled peppers.

peck peter piper picked a peck of pickled peppers.

peck peter piper picked a peck of pickled peppers.

peck peter piper picked a peck of pickled peppers.

peck peter piper picked a peck of pickled peppers.

peck peter piper picked a peck of pickled peppers.

peck */ 7.45. Напишите аналогичную программу, выдающую все строки, удовлетворяющие упрощенному регуляр ному выражению, задаваемому как аргумент для main(). Используйте функцию match, написанную нами ранее. Вы написали аналог программы grep из UNIX (но с другим типом регулярного выражения, нежели в оригинале).

7.46. Составьте функцию expand(s1, s2), которая расширяет сокращенные обозначения вида a-z строки s в эквивалентный полный список abcd...xyz в строке s2. Допускаются сокращения для строчных и прописных букв и цифр. Учтите случаи типа abc, az09 и ag (соглашение состоит в том, что символ "", стоящий в начале или в конце, воспринимается буквально).

А. Богатырёв, 1992-96 - 275 - Си в UNIX™ 7.47. Напишите программу, читающую файл и заменяющую строки вида |<1 и более пробелов и табуляций><текст> на пары строк |.pp |<текст> (здесь | обозначает левый край файла, a <> - метасимволы). Это - простейший препроцессор, готовящий текст в формате nroff (это форматтер текстов в UNIX). Усложнения:

• строки, начинающиеся с точки или с апострофа, заменять на \&<текст, начинающийся с точки или '> • строки, начинающиеся с цифры, заменять на.ip <число> <текст> • символ \ заменять на последовательность \e.

• удалять пробелы перед символами.,;

:!?) и вставлять после них пробел (знак препинания должен быть приклеен к концу слова, иначе он может быть перенесен на следующую строку. Вы когда-нибудь видели строку, начинающуюся с запятой?).

• склеивать перенесенные слова, поскольку nroff делает переносы сам:

....xxxx начало- =>....xxxx началоконец конец yyyy...... yyyy................

Вызывайте этот препроцессор разметки текста так:

$ prep файлы... | nroff -me > text.lp 7.48. Составьте программу преобразования прописных букв из файла ввода в строчные, используя при этом функцию, в которой необходимо организовать анализ символа (действительно ли это буква). Строчные буквы выдавать без изменения. Указание: используйте макросы из .

Ответ:

#include #include main(){ int c;

while( (c = getchar()) != EOF ) putchar( isalpha( c ) ?

(isupper( c ) ? tolower( c ) : c) : c);

} либо...

putchar( isalpha(c) && isupper(c) ? tolower(c) : c );

либо даже putchar( isupper(c) ? tolower(c) : c );

В последнем случае под isupper и islower должны пониматься только буквы (увы, не во всех реализациях это так!).

7.49. Обратите внимание, что если мы выделяем класс символов при помощи сравнения, например:

char ch;

if( 0300 <= ch && ch < 0340 )...;

(в кодировке КОИ-8 это маленькие русские буквы), то мы можем натолкнуться на следующий сюрприз:

перед сравнением с целым значение ch приводится к типу int (приведение также делается при использова нии char в качестве аргумента функции). При этом, если у ch был установлен старший бит (0200), произой дет расширение его во весь старший байт (расширение знакового бита). Результатом будет отрицательное целое число! Опыт:

char c = '\201';

/* = 129 */ printf( "%d\n", c );

печатается -127. Таким образом, наше сравнение не сработает, т.к. оказывается что ch < 0. Следует пода влять расширение знака:

if( 0300 <= (ch & 0377) && (ch & 0377) < 0340)...;

(0377 - маска из 8 бит, она же 0xFF, весь байт), либо объявить А. Богатырёв, 1992-96 - 276 - Си в UNIX™ unsigned char ch;

что означает, что при приведении к int знаковый бит не расширяется.

7.50. Рассмотрим еще один пример:

main(){ char ch;

/* 0377 - код последнего символа алфавита ASCII */ for (ch = 0100;

ch <= 0377;

ch++ ) printf( "%03o %s\n", ch & 0377, ch >= 0300 && ch < 0340 ? "yes" : "no" );

} Какие неприятности ждут нас здесь?

• во-первых, когда бит 0200 у ch установлен, в сравнении ch выступает как отрицательное целое число (т.к. приведение к int делается расширением знакового бита), то есть у нас всегда печатается "no". Это мы можем исправить, написав unsigned char ch, либо используя ch в виде (ch & 0377) или ((unsigned) ch) • во-вторых, рассмотрим сам цикл. Пусть сейчас ch =='\377'. Условие ch <= 0377 истинно. Выполняется оператор ch++. Но ch - это байт, поэтому операции над ним производятся по модулю 0400 (0377 - это максимальное значение, которое можно хранить в байте - все биты единицы). То есть теперь значе нием ch станет 0. Но 0 < 0377 и условие цикла верно! Цикл продолжается;

т.е. происходит зациклива ние. Избежать этого можно только описав int ch;

чтобы 0377+1 было равно 0400, а не 0 (или unsigned int, лишь бы длины переменной хватало, чтобы вместить число больше 0377).

7.51. Составьте программу, преобразующую текст, состоящий только из строчных букв в текст, состоящий из прописных и строчных букв. Первая буква и буква после каждой точки - прописные, остальные - строч ные.

слово один. слово два. --> Слово один. Слово два.

Эта программа может оказаться полезной для преобразования текста, набранного в одном регистре, в текст, содержащий буквы обоих регистров.

7.52. Напишите программу, исправляющую опечатки в словах (spell check): программе задан список слов;

она проверяет - является ли введенное вами слово словом из списка. Если нет - пытается найти наиболее похожее слово из списка, причем если есть несколько похожих - выдает все варианты. Отлавливайте слу чаи:

• две соседние буквы переставлены местами: ножинцы=>ножницы;

• удвоенная буква (буквы): ккаррандаш=>карандаш;

• потеряна буква: бот=>болт;

• измененная буква: бинт=>бант;

• лишняя буква: морда=>мода;

• буквы не в том регистре - сравните с каждым словом из списка, приводя все буквы к маленьким:

сОВОк=>совок;

Надо проверять каждую букву слова. Возможно вам будет удобно использовать рекурсию. Подсказка: для некоторых проверок вам может помочь функция match:

слово_таблицы = "дом";

if(strlen(входное_слово) <= strlen(слово_таблицы)+1 && match(входное_слово, "*д*о*м*")... /* похоже */ *о*м* ?дом дом?

*д*м* д?ом *д*о* до?м Приведем вариант решения этой задачи:

А. Богатырёв, 1992-96 - 277 - Си в UNIX™ #include #include #include typedef unsigned char uchar;

#define ANYCHAR '*' /* символ, сопоставляющийся с одной любой буквой */ static uchar version[120];

/* буфер для генерации вариантов */ static uchar vv;

/* буква, сопоставившаяся с ANYCHAR */ /* привести все буквы к одному регистру */ static uchar icase(uchar c){ return isupper(c) ? tolower(c) : c;

} /* сравнение строк с игнорированием регистра */ static int eqi(uchar *s1, uchar *s2 ) { while( *s1 && *s2 ){ if( icase( *s1 ) != icase( *s2 )) break;

s1++;

s2++;

} return ( ! *s1 && ! *s2 ) ? 1 : 0 ;

/* OK : FAIL */ } /* сравнение строк с игнорированием ANYCHAR */ static strok(register uchar *word, register uchar *pat) { while( *word && *pat ){ if( *word == ANYCHAR){ /* Неважно, что есть *pat, но запомним */ vv= *pat;

} else { if( icase(*pat) != icase(*word) ) break;

} word++;

pat++;

} /* если слова кончились одновременно... */ return ( !*word && !*pat) ? 1 : 0;

/* OK : FAIL */ } /* ЛИШНЯЯ БУКВА */ static int superfluous( uchar *word /* слово для коррекции */, uchar *s /* эталон */ ){ register int i,j,k;

int reply;

register len = strlen(word);

for(i=0 ;

i < len ;

i++){ /* генерим слова, получающиеся удалением одной буквы */ k=0;

for(j=0 ;

j < i ;

j++) version[k++]=word[j];

for(j=i+1 ;

j < len ;

j++) version[k++]=word[j];

version[k]='\0';

if( eqi( version, s )) return 1;

/* OK */ } return 0;

/* FAIL */ } А. Богатырёв, 1992-96 - 278 - Си в UNIX™ /* ПОТЕРЯНА БУКВА */ static int hole;

/* место, где вставлена ANYCHAR */ static int lost(uchar *word, uchar *s) { register int i,j,k;

register len = strlen(word);

hole= (-1);

for(i=0 ;

i < len+1 ;

i++){ k=0;

for(j=0 ;

j < i ;

j++) version[k++]=word[j];

version[k++]=ANYCHAR;

for(j=i ;

j < len ;

j++) version[k++]=word[j];

version[k]='\0';

if( strok( version, s )){ hole=i;

return 1;

/* OK */ } } return 0;

/* FAIL */ } /* ИЗМЕНИЛАСЬ ОДНА БУКВА (включает случай ошибки регистра) */ static int changed(uchar *word, uchar *s) { register int i,j,k;

register len = strlen(word);

hole = (-1);

for(i=0 ;

i < len ;

i++){ k=0;

for( j=0 ;

j < i ;

j++) version[k++]=word[j];

version[k++]=ANYCHAR;

for( j=i+1 ;

j < len ;

j++) version[k++]=word[j];

version[k]='\0';

if( strok( version,s)){ hole=i;

return 1;

/* OK */ } } return 0;

/* FAIL */ } А. Богатырёв, 1992-96 - 279 - Си в UNIX™ /* УДВОЕННАЯ БУКВА */ static int duplicates(uchar *word, uchar *s, int leng) { register int i,j,k;

uchar tmp[80];

if( eqi( word, s )) return 1;

/* OK */ for(i=0;

i < leng - 1;

i++) /* ищем парные буквы */ if( word[i]==word[i+1]){ k=0;

for(j=0 ;

j < i ;

j++) tmp[k++]=word[j];

for(j=i+1 ;

j < leng ;

j++) tmp[k++]=word[j];

tmp[k]='\0';

if( duplicates( tmp, s, leng-1) == 1) return 1;

/* OK */ } return 0;

/* FAIL */ } /* ПЕРЕСТАВЛЕНЫ СОСЕДНИЕ БУКВЫ */ static int swapped(uchar *word, uchar *s) { register int i,j,k;

register len = strlen(word);

for(i=0;

i < len-1;

i++){ k=0;

for(j=0 ;

j < i ;

j++) version[k++]=word[j];

version[k++]=word[i+1];

version[k++]=word[i];

for(j=i+2 ;

j < len ;

j++) version[k++]=word[j];

version[k]='\0';

if( eqi( version, s)) return 1;

/* OK */ } return 0;

/* FAIL */ } uchar *words[] ={ (uchar *) "bag", (uchar *) "bags", (uchar *) "cook", (uchar *) "cool", (uchar *) "bug", (uchar *) "buy", (uchar *) "cock", NULL };

#define Bcase(x, operators) case x: { operators;

} break;

char *cname[5] = { "переставлены буквы", "удвоены буквы ", "потеряна буква ", "ошибочная буква ", "лишняя буква " };

А. Богатырёв, 1992-96 - 280 - Си в UNIX™ static int spellmatch( uchar *word /* IN слово для коррекции */, uchar *words[] /* IN таблица допустимых слов */, uchar **indx /* OUT ответ */ ){ int i, code, total = (-1);

uchar **ptr;

if(!*word) return -1;

for(ptr = words;

*ptr;

++ptr) if(eqi(word, *ptr)){ if(indx) *indx = *ptr;

return 0;

} /* Нет в таблице, нужен подбор похожих */ for(ptr = words;

*ptr;

++ptr){ uchar *s = *ptr;

int max = 5;

for(i=0;

i < max;

i++){ switch( i ){ Bcase(0,code = swapped(word, s) ) Bcase(1,code = duplicates(word, s, strlen(word)) ) Bcase(2,code = lost(word, s) ) Bcase(3,code = changed(word, s) ) Bcase(4,code = superfluous(word, s) ) } if(code){ total++;

printf("?\t%s\t%s\n", cname[i], s);

if(indx) *indx = s;

/* В случае с дубликатами не рассматривать * на наличие лишних букв */ if(i==1) max = 4;

} } } return total;

} void main(){ uchar inpbuf[BUFSIZ];

int n;

uchar *reply, **ptr;

setlocale(LC_ALL, "");

for(ptr = words;

*ptr;

ptr++) printf("#\t%s\n", *ptr);

do{ printf("> ");

fflush(stdout);

if(gets((char *)inpbuf) == NULL) break;

switch(spellmatch(inpbuf, words, &reply)){ case -1:

printf("Нет такого слова\n");

break;

case 0:

printf("Слово '%s'\n", reply);

break;

default:

printf("Неоднозначно\n");

} } while(1);

} А. Богатырёв, 1992-96 - 281 - Си в UNIX™ 7.53. Пока я сам писал эту программу, я сделал две ошибки, которые должны быть весьма характерны для новичков. Про них надо бы говорить раньше, в главе про строки и в самой первой главе, но тут они при шлись как раз к месту. Вопрос: что печатает следующая программа?

#include char *strings[] = { "Первая строка" "Вторая строка" "Третяя строка", "Четвертая строка", NULL };

void main(){ char **p;

for(p=strings;

*p;

++p) printf("%s\n", *p);

} А печатает она вот что:

Первая строкаВторая строкаТретяя строка Четвертая строка Дело в том, что ANSI компилятор Си склеивает строки:

"начало строки" "и ее конец" если они разделены пробелами в смысле isspace, в том числе и пустыми строками. А в нашем объявлении массива строк strings мы потеряли несколько разделительных запятых!

Вторая ошибка касается того, что можно забыть поставить слово break в операторе switch, и долго после этого гадать о непредсказуемом поведении любого поступающего на вход значения. Дело просто:

пробегаются все случаи, управление проваливается из case в следующий case, и так много раз подряд!

Это и есть причина того, что в предыдущем примере все case оформлены нетривиальным макросом Bcase.

7.54. Составьте программу кодировки и раскодировки файлов по заданному ключу (строке символов).

7.55. Составьте программу, которая запрашивает анкетные данные типа фамилии, имени, отчества, даты рождения и формирует файл. Программа должна отлавливать ошибки ввода несимвольной и нецифровой информации, выхода составляющих даты рождения за допустимые границы с выдачей сообщений об ошиб ках. Программа должна давать возможность корректировать вводимые данные. Все данные об одном чело веке записываются в одну строку файла через пробел. Вот возможный пример части диалога (ответы поль зователя выделены жирно):

Введите месяц рождения [1-12]: 14 *** Неправильный номер месяца (14).

Введите месяц рождения [1-12]: март *** Номер месяца содержит букву 'м'.

Введите месяц рождения [1-12]: Вы хотите закончить ввод ? n Введите месяц рождения [1-12]: 11 Ноябрь Введите дату рождения [1-30]: _ В таких программах обычно ответ пользователя вводится как строка:

printf("Введите месяц рождения [1-12]: ");

fflush(stdout);

gets(input_string);

затем (если надо) отбрасываются лишние пробелы в начале и в конце строки, затем введенный текст input_string анализируется на допустимость символов (нет ли в нем не цифр?), затем строка преобразуется к нужному типу (например, при помощи функции atoi переводится в целое) и проверяется допустимость полученного значения, и.т.д.

Вводимую информацию сначала заносите в структуру;

затем записывайте содержимое полей струк туры в файл в текстовом виде (используйте функцию fprintf, а не fwrite).

7.56. Составьте программу, осуществляющую выборку информации из файла, сформированного в преды дущей задаче, и ее распечатку в табличном виде. Выборка должна осуществляться по значению любого заданного поля (т.е. вы выбираете поле, задаете его значение и получаете те строки, в которых значение А. Богатырёв, 1992-96 - 282 - Си в UNIX™ указанного поля совпадает с заказанным вами значением). Усложнение: используйте функцию сравнения строки с регулярным выражением для выборки по шаблону поля (т.е. отбираются только те строки, в кото рых значение заданного поля удовлетворяет шаблону). Для чтения файла используйте fscanf, либо fgets и затем sscanf. Второй способ лучше тем, что позволяет проверить по шаблону значение любого поля - не только текстового, но и числового: так 1234 (строка - изображение числа) удовлетворяет шаблону "12*".

7.57. Составьте вариант программы подсчета служебных слов языка Си, не учитывающий появление этих слов, заключенных в кавычки.

7.58. Составьте программу удаления из программы на языке Си всех комментариев. Обратите внимание на особые случаи со строками в кавычках и символьными константами;

так строка char s[] = "/*";

не является началом комментария! Комментарии записывайте в отдельный файл.

7.59. Составьте программу выдачи перекрестных ссылок, т.е. программу, которая выводит список всех идентификаторов переменных, используемых в программе, и для каждого из идентификаторов выводит спи сок номеров строк, в которые он входит.

7.60. Разработайте простую версию препроцессора для обработки операторов #include. В качестве про тотипа такой программы можно рассматривать такую (она понимает директивы вида #include имяфайла без <> или "").

#include #include #include char KEYWORD[] = "#include ";

/* with a trailing space char */ void process(char *name, char *from){ FILE *fp;

char buf[4096];

if((fp = fopen(name, "r")) == NULL){ fprintf(stderr, "%s: cannot read \"%s\", %s\n", from, name, strerror(errno));

return;

} while(fgets(buf, sizeof buf, fp) != NULL){ if(!strncmp(buf, KEYWORD, sizeof KEYWORD - 1)){ char *s;

if((s = strchr(buf, '\n')) != NULL) *s = '\0';

fprintf(stderr, "%s: including %s\n", name, s = buf + sizeof KEYWORD - 1);

process(s, name);

} else fputs(buf, stdout);

} fclose(fp);

} int main(int ac, char *av[]){ int i;

for(i=1;

i < ac;

i++) process(av[i], "MAIN");

return 0;

} 7.61. Разработайте простую версию препроцессора для обработки операторов #define. Сначала реали зуйте макросы без аргументов. Напишите обработчик макросов вида #macro имя(аргу,менты) тело макроса - можно несколько строк #endm А. Богатырёв, 1992-96 - 283 - Си в UNIX™ 7.62. Напишите программу, обрабатывающую определения #ifdef, #else, #endif. Учтите, что эти дирек тивы могут быть вложенными:

#ifdef A # ifdef B... /* defined(A) && defined(B) */ # endif /*B*/... /* defined(A) */ #else /*not A*/... /* !defined(A) */ # ifdef C... /* !defined(A) && defined(C) */ # endif /*C*/ #endif /*A*/ 7.63. Составьте программу моделирования простейшего калькулятора, который считывает в каждой строчке по одному числу (возможно со знаком) или по одной операции сложения или умножения, осуще ствляет операцию и выдает результат.

7.64. Составьте программу-калькулятор, которая производит операции сложения, вычитания, умножения, деления;

операнды и знак арифметической операции являются строковыми аргументами функции main.

7.65. Составьте программу, вычисляющую значение командной строки, представляющей собой обратную польскую запись арифметического выражения. Например, 20 10 5 + * вычисляется как 20 * (10 + 5).

7.66. Составьте функции работы со стеком:

• добавление в стек • удаление вершины стека (с возвратом удаленного значения) Используйте два варианта: стек-массив и стек-список.

7.67. Составьте программу, которая использует функции работы со стеком для перевода арифметических выражений языка Си в обратную польскую запись.

/*#!/bin/cc $* -lm * Калькулятор. Иллюстрация алгоритма превращения выражений * в польскую запись по методу приоритетов.

*/ #include #include /* extern double atof();

*/ #include /* extern double sin(),... */ #include /* isdigit(), isalpha(),... */ #include /* jmp_buf */ jmp_buf AGAIN;

/* контрольная точка */ err(n){ longjmp(AGAIN,n);

} /* прыгнуть в контрольную точку */ А. Богатырёв, 1992-96 - 284 - Си в UNIX™ /* ВЫЧИСЛИТЕЛЬ --------------------------------------- */ /* Если вместо помещения операндов в стек stk[] просто * печатать операнды, а вместо выполнения операций над * стеком просто печатать операции, мы получим "польскую" * запись выражения:

* a+b -> ab+ * (a+b)*c -> ab+c* * a + b*c -> abc*+ */ /* стек вычислений */ #define MAXDEPTH 20 /* глубина стеков */ int sp;

/* указатель стека (stack pointer) */ double stk[MAXDEPTH];

double dpush(d) double d;

/* занести число в стек */ { if( sp == MAXDEPTH ){ printf("Стек операндов полон\n");

err(1);

} else return( stk[sp++] = d );

} double dpop(){ /* взять вершину стека */ if( !sp ){ printf("Стек операндов пуст\n");

err(2);

} else return stk[--sp];

} static double r,p;

/* вспомогательные регистры */ void add() { dpush( dpop() + dpop());

} void mult() { dpush( dpop() * dpop());

} void sub() { r = dpop();

dpush( dpop() - r);

} void divide() { r = dpop();

if(r == 0.0){ printf("Деление на 0\n");

err(3);

} dpush( dpop() / r );

} void pwr() { r = dpop();

dpush( pow( dpop(), r ));

} void dup() { dpush( dpush( dpop()));

} void xchg(){ r = dpop();

p = dpop();

dpush(r);

dpush(p);

} void neg() { dpush( - dpop());

} void dsin(){ dpush( sin( dpop()));

} void dcos(){ dpush( cos( dpop()));

} void dexp(){ dpush( exp( dpop()));

} void dlog(){ dpush( log( dpop()));

} void dsqrt(){ dpush( sqrt( dpop()));

} void dsqr(){ dup();

mult();

} /* M_PI и M_E определены в */ void pi() { dpush( M_PI /* число пи */ );

} void e() { dpush( M_E /* число e */ );

} void prn() { printf("%g\n", dpush( dpop()));

} void printstk(){ if( !sp ){ printf("Стек операндов пуст\n");

err(4);

} while(sp) printf("%g ", dpop());

putchar('\n');

} А. Богатырёв, 1992-96 - 285 - Си в UNIX™ /* КОМПИЛЯТОР ---------------------------------------- */ /* номера лексем */ #define END (-3) /* = */ #define NUMBER (-2) /* число */ #define BOTTOM 0 /* псевдолексема "дно стека" */ #define OPENBRACKET 1 /* ( */ #define FUNC 2 /* f( */ #define CLOSEBRACKET 3 /* ) */, */ #define COMMA 4 /* #define PLUS 5 /* + */ #define MINUS 6 /* - */ #define MULT 7 /* * */ #define DIV 8 /* / */ #define POWER 9 /* ** */ /* Приоритеты */ #define NOTDEF 333 /* не определен */ #define INFINITY 3000 /* бесконечность */ /* Стек транслятора */ typedef struct _opstack { int cop;

/* код операции */ void (*f)();

/* "отложенное" действие */ } opstack;

int osp;

/* operations stack pointer */ opstack ost[MAXDEPTH];

void push(n, func) void (*func)();

{ if(osp == MAXDEPTH){ printf("Стек операций полон\n");

err(5);

} ost[osp].cop = n;

ost[osp++].f = func;

} int pop(){ if( !osp ){ printf("Стек операций пуст\n");

err(6);

} return ost[--osp].cop;

} int top(){ if( !osp ){ printf("Стек операций пуст\n");

err(7);

} return ost[osp-1].cop;

} void (*topf())(){ return ost[osp-1].f;

} #define drop() (void)pop() void nop(){ printf( "???\n" );

} /* no operation */ void obr_err(){ printf( "Не хватает )\n" );

err(8);

} А. Богатырёв, 1992-96 - 286 - Си в UNIX™ /* Таблица приоритетов */ struct synt{ int inp_prt;

/* входной приоритет */ int stk_prt;

/* стековый приоритет */ void (*op)();

/* действие над стеком вычислений */ } ops[] = { /* BOTTOM */ {NOTDEF, -1, nop }, /* OPENBRACKET */ {INFINITY, 0, obr_err}, /* FUNC */ {INFINITY, 0, obr_err}, /* CLOSEBRACKET */ {1, NOTDEF, nop }, /* NOPUSH */ /* COMMA */ {1, NOTDEF, nop }, /* NOPUSH */ /* PLUS */ {1, 1, add }, /* MINUS */ {1, 1, sub }, /* MULT */ {2, 2, mult }, /* DIV */ {2, 2, divide }, /* POWER */ {3, 3, pwr } };

#define stkprt(i) ops[i].stk_prt #define inpprt(i) ops[i].inp_prt #define perform(i) (*ops[i].op)() /* значения, заполняемые лексическим анализатором */ double value;

void (*fvalue)();

int tprev;

/* предыдущая лексема */ А. Богатырёв, 1992-96 - 287 - Си в UNIX™ /* Транслятор в польскую запись + интерпретатор */ void reset(){ sp = osp = 0;

push(BOTTOM, NULL);

tprev = END;

} void calc(){ int t;

do{ if( setjmp(AGAIN)) printf( "Стеки после ошибки сброшены\n" );

reset();

while((t = token()) != EOF && t != END){ if(t == NUMBER){ if(tprev == NUMBER){ printf("%g:Два числа подряд\n",value);

err(9);

} /* любое число просто заносится в стек */ tprev = t;

dpush(value);

continue;

} /* иначе - оператор */ tprev = t;

/* Выталкивание и выполнение операций со стека */ while(inpprt(t) <= stkprt( top()) ) perform( pop());

/* Сокращение или подмена скобок */ if(t == CLOSEBRACKET){ if( top() == OPENBRACKET || top() == FUNC ){ void (*ff)() = topf();

drop();

/* схлопнуть скобки */ /* обработка функции */ if(ff) (*ff)();

}else{ printf( "Не хватает (\n");

err(10);

} } /* Занесение операций в стек (кроме NOPUSH-операций) */ if(t != CLOSEBRACKET && t != COMMA) push(t, t == FUNC ? fvalue : NULL );

} if( t != EOF ){ /* Довыполнить оставшиеся операции */ while( top() != BOTTOM ) perform( pop());

printstk();

/* печать стека вычислений (ответ) */ } } while (t != EOF);

} /* Лексический анализатор ---------------------------- */ extern void getn(), getid(), getbrack();

int token(){ /* прочесть лексему */ int c;

while((c = getchar())!= EOF && (isspace(c) || c == '\n'));

if(c == EOF) return EOF;

ungetc(c, stdin);

if(isdigit(c)){ getn();

return NUMBER;

} if(isalpha(c)){ getid();

getbrack();

return FUNC;

} return getop();

} А. Богатырёв, 1992-96 - 288 - Си в UNIX™ /* Прочесть число (с точкой) */ void getn(){ int c, i;

char s[80];

s[0] = getchar();

for(i=1;

isdigit(c = getchar());

i++ ) s[i] = c;

if(c == '.'){ /* дробная часть */ s[i] = c;

for(i++;

isdigit(c = getchar());

i++) s[i] = c;

} s[i] = '\0';

ungetc(c, stdin);

value = atof(s);

} /* Прочесть операцию */ int getop(){ int c;

switch( c = getchar()){ case EOF: return EOF;

case '=': return END;

case '+': return PLUS;

case '-': return MINUS;

case '/': return DIV;

case '*': c = getchar();

if(c == '*') return POWER;

else{ ungetc(c, stdin);

return MULT;

} case '(': return OPENBRACKET;

case ')': return CLOSEBRACKET;

case ',': return COMMA;

default: printf( "Ошибочная операция %c\n", c);

return token();

} } struct funcs{ /* Таблица имен функций */ char *fname;

void (*fcall)();

} tbl[] = { { "sin", dsin }, { "cos", dcos }, { "exp", dexp }, { "sqrt", dsqrt }, { "sqr", dsqr }, { "pi", pi }, { "sum", add }, { "ln", dlog }, { "e", e }, { NULL, NULL } };

char *lastf;

/* имя найденной функции */ /* Прочесть имя функции */ void getid(){ struct funcs *ptr = tbl;

char name[80];

int c, i;

*name = getchar();

for(i=1;

isalpha(c = getchar());

i++) name[i] = c;

name[i] = '\0';

ungetc(c, stdin);

/* поиск в таблице */ for( ;

ptr->fname;

ptr++ ) if( !strcmp(ptr->fname, name)){ fvalue = ptr->fcall;

lastf = ptr->fname;

return;

} printf( "Функция \"%s\" неизвестна\n", name );

err(11);

} А. Богатырёв, 1992-96 - 289 - Си в UNIX™ /* прочесть открывающую скобку после имени функции */ void getbrack(){ int c;

while((c = getchar()) != EOF && c != '(' ) if( !isspace(c) && c != '\n' ){ printf("Между именем функции %s и ( символ %c\n", lastf, c);

ungetc(c, stdin);

err(12);

} } void main(){ calc();

} /* Примеры:

( sin( pi() / 4 + 0.1 ) + sum(2, 4 + 1)) * (5 - 4/2) = ответ: 23. (14 + 2 ** 3 * 7 + 2 * cos(0)) / ( 7 - 4 ) = ответ: */ 7.68. Приведем еще один арифметический вычислитель, использующий классический рекурсивный подход:

/* Калькулятор на основе рекурсивного грамматического разбора.

* По мотивам арифметической части программы csh (СиШелл).

* csh написан Биллом Джоем (Bill Joy).

: var1 = (x = 1+3) * (y=x + x++) :s=s+1 ошибка :y : s = (1 + 1 << 2) == 1 + (1<<2) : var1 + 3 + -77 - : a1 = 3;

a2 = (a4=a3 = 2;

a1++)+a4+2 : sum(a=2;

b=3, a++, a*3-b) */ #include #include #include typedef enum { NUM, ID, OP, OPEN, CLOSE, UNKNOWN, COMMA, SMC } TokenType;

char *toknames[] = { "number", "identifier", "operation", "open_paren", "close_paren", "unknown", "comma", "semicolon" };

typedef struct _Token { char *token;

/* лексема (слово) */ struct _Token *next;

/* ссылка на следующую */ TokenType type;

/* тип лексемы */ } Token;

extern void *malloc(unsigned);

extern char *strchr(char *, char);

char *strdup(const char *s){ char *p = (char *)malloc(strlen(s)+1);

if(p) strcpy(p,s);

return p;

} /* Лексический разбор ------------------------------------------*/ /* Очистить цепочку токенов */ void freelex(Token **p){ Token *thisTok = *p;

while( thisTok ){ Token *nextTok = thisTok->next;

free((char *) thisTok->token);

free((char *) thisTok);

thisTok = nextTok;

} *p = NULL;

} А. Богатырёв, 1992-96 - 290 - Си в UNIX™ /* Добавить токен в хвост списка */ void addtoken(Token **hd, Token **tl, char s[], TokenType t){ Token *newTok = (Token *) malloc(sizeof(Token));

newTok->next = (Token *) NULL;

newTok->token = strdup(s);

newTok->type = t;

if(*hd == NULL) *hd = *tl = newTok;

else{ (*tl)->next = newTok;

*tl = newTok;

Pages:     | 1 |   ...   | 3 | 4 || 6 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.