xemacs-beta: src/mule-coding.c annotate

author	cvs
date	Mon, 13 Aug 2007 09:02:59 +0200
parents
children	54cc21c15cbb

rev	line source
70 131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	1 /* Code conversion functions.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	2 Copyright (C) 1991, 1995 Free Software Foundation, Inc.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	3 Copyright (C) 1995 Sun Microsystems, Inc.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	4
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	5 This file is part of XEmacs.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	6
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	7 XEmacs is free software; you can redistribute it and/or modify it
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	8 under the terms of the GNU General Public License as published by the
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	9 Free Software Foundation; either version 2, or (at your option) any
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	10 later version.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	11
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	12 XEmacs is distributed in the hope that it will be useful, but WITHOUT
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	13 ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	14 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	15 for more details.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	16
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	17 You should have received a copy of the GNU General Public License
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	18 along with XEmacs; see the file COPYING. If not, write to
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	19 the Free Software Foundation, Inc., 59 Temple Place - Suite 330,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	20 Boston, MA 02111-1307, USA. */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	21
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	22 /* Synched up with: Mule 2.3. Not in FSF. */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	23
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	24 /* Rewritten by Ben Wing <wing@666.com>. */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	25
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	26 #include <config.h>
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	27 #include "lisp.h"
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	28
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	29 #include "buffer.h"
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	30 #include "elhash.h"
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	31 #include "insdel.h"
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	32 #include "lstream.h"
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	33 #include "mule-coding.h"
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	34
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	35 Lisp_Object Qfile_coding_system, Qcoding_system_error;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	36
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	37 Lisp_Object Vkeyboard_coding_system;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	38 Lisp_Object Vterminal_coding_system;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	39 Lisp_Object Vprocess_input_coding_system;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	40 Lisp_Object Vprocess_output_coding_system;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	41 Lisp_Object Vpathname_coding_system;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	42
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	43 /* Table of symbols identifying each coding category. */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	44 Lisp_Object coding_category_symbol[CODING_CATEGORY_LAST + 1];
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	45
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	46 /* Coding system currently associated with each coding category. */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	47 Lisp_Object coding_category_system[CODING_CATEGORY_LAST + 1];
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	48
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	49 /* Table of all coding categories in decreasing order of priority.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	50 This describes a permutation of the possible coding categories. */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	51 int coding_category_by_priority[CODING_CATEGORY_LAST + 1];
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	52
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	53 Lisp_Object Qcoding_system_p;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	54
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	55 Lisp_Object Qbig5, Qshift_jis, Qno_conversion, Qccl, Qiso2022;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	56 /* Qinternal in general.c */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	57
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	58 Lisp_Object Qmnemonic, Qeol_type;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	59 Lisp_Object Qcr, Qcrlf, Qlf;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	60 Lisp_Object Qeol_cr, Qeol_crlf, Qeol_lf;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	61 Lisp_Object Qpost_read_conversion;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	62 Lisp_Object Qpre_write_conversion;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	63
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	64 Lisp_Object Qcharset_g0, Qcharset_g1, Qcharset_g2, Qcharset_g3;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	65 Lisp_Object Qforce_g0_on_output, Qforce_g1_on_output;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	66 Lisp_Object Qforce_g2_on_output, Qforce_g3_on_output;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	67 Lisp_Object Qshort, Qno_ascii_eol, Qno_ascii_cntl, Qseven, Qlock_shift;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	68 Lisp_Object Qno_iso6429, Qescape_quoted;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	69 Lisp_Object Qinput_charset_conversion, Qoutput_charset_conversion;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	70
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	71 Lisp_Object Qencode, Qdecode;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	72
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	73 Lisp_Object Qctext;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	74
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	75 Lisp_Object Vcoding_system_hashtable;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	76
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	77 /* Additional information used by the ISO2022 decoder and detector. */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	78 struct iso2022_decoder
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	79 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	80 /* CHARSET holds the character sets currently assigned to the G0
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	81 through G3 variables. It is initialized from the array
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	82 INITIAL_CHARSET in CODESYS. */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	83 Lisp_Object charset[4];
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	84
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	85 /* Which registers are currently invoked into the left (GL) and
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	86 right (GR) halves of the 8-bit encoding space? */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	87 int register_left, register_right;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	88
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	89 /* ISO_ESC holds a value indicating part of an escape sequence
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	90 that has already been seen. */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	91 enum iso_esc_flag esc;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	92
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	93 /* This records the bytes we've seen so far in an escape sequence,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	94 in case the sequence is invalid (we spit out the bytes unchanged). */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	95 unsigned char esc_bytes[8];
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	96
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	97 /* Index for next byte to store in ISO escape sequence. */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	98 int esc_bytes_index;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	99
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	100 /* Stuff seen so far when composing a string. */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	101 unsigned_char_dynarr *composite_chars;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	102
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	103 /* If we saw an invalid designation sequence for a particular
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	104 register, we flag it here and switch to ASCII. The next time we
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	105 see a valid designation for this register, we turn off the flag
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	106 and do the designation normally, but pretend the sequence was
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	107 invalid. The effect of all this is that (most of the time) the
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	108 escape sequences for both the switch to the unknown charset, and
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	109 the switch back to the known charset, get inserted literally into
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	110 the buffer and saved out as such. The hope is that we can
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	111 preserve the escape sequences so that the resulting written out
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	112 file makes sense. If we don't do any of this, the designation
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	113 to the invalid charset will be preserved but that switch back
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	114 to the known charset will probably get eaten because it was
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	115 the same charset that was already present in the register. */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	116 unsigned char invalid_designated[4];
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	117
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	118 /* We try to do similar things as above for direction-switching
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	119 sequences. If we encountered a direction switch while an
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	120 invalid designation was present, or an invalid designation
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	121 just after a direction switch (i.e. no valid designation
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	122 encountered yet), we insert the direction-switch escape
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	123 sequence literally into the output stream, and later on
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	124 insert the corresponding direction-restoring escape sequence
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	125 literally also. */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	126 int switched_dir_and_no_valid_charset_yet :1;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	127 int invalid_switch_dir :1;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	128
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	129 /* Tells the decoder to output the escape sequence literally
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	130 even though it was valid. Used in the games we play to
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	131 avoid lossage when we encounter invalid designations. */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	132 int output_literally :1;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	133 /* We encountered a direction switch followed by an invalid
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	134 designation. We didn't output the direction switch
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	135 literally because we didn't know about the invalid designation;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	136 but we have to do so now. */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	137 int output_direction_sequence :1;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	138 };
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	139
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	140 Lisp_Object Fcopy_coding_system (Lisp_Object old_coding_system,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	141 Lisp_Object new_name);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	142 struct detection_state;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	143 static int detect_coding_shift_jis (struct detection_state *st,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	144 CONST unsigned char *src,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	145 unsigned int n);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	146 static void decode_coding_shift_jis (Lstream *decoding,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	147 CONST unsigned char *src,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	148 unsigned_char_dynarr *dst,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	149 unsigned int n);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	150 static void encode_coding_shift_jis (Lstream *encoding,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	151 CONST unsigned char *src,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	152 unsigned_char_dynarr *dst,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	153 unsigned int n);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	154 static int detect_coding_big5 (struct detection_state *st,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	155 CONST unsigned char *src,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	156 unsigned int n);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	157 static void decode_coding_big5 (Lstream *decoding,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	158 CONST unsigned char *src,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	159 unsigned_char_dynarr *dst, unsigned int n);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	160 static void encode_coding_big5 (Lstream *encoding,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	161 CONST unsigned char *src,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	162 unsigned_char_dynarr *dst, unsigned int n);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	163 static int postprocess_iso2022_mask (int mask);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	164 static void reset_iso2022 (Lisp_Object coding_system,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	165 struct iso2022_decoder *iso);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	166 static int detect_coding_iso2022 (struct detection_state *st,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	167 CONST unsigned char *src,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	168 unsigned int n);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	169 static void decode_coding_iso2022 (Lstream *decoding,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	170 CONST unsigned char *src,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	171 unsigned_char_dynarr *dst, unsigned int n);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	172 static void encode_coding_iso2022 (Lstream *encoding,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	173 CONST unsigned char *src,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	174 unsigned_char_dynarr *dst, unsigned int n);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	175 static void decode_coding_no_conversion (Lstream *decoding,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	176 CONST unsigned char *src,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	177 unsigned_char_dynarr *dst,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	178 unsigned int n);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	179 static void encode_coding_no_conversion (Lstream *encoding,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	180 CONST unsigned char *src,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	181 unsigned_char_dynarr *dst,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	182 unsigned int n);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	183 static void mule_decode (Lstream decoding, CONST unsigned char src,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	184 unsigned_char_dynarr *dst, unsigned int n);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	185 static void mule_encode (Lstream encoding, CONST unsigned char src,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	186 unsigned_char_dynarr *dst, unsigned int n);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	187
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	188 struct codesys_prop
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	189 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	190 Lisp_Object sym;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	191 int prop_type;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	192 };
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	193
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	194 typedef struct codesys_prop_dynarr_type
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	195 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	196 Dynarr_declare (struct codesys_prop);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	197 } codesys_prop_dynarr;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	198
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	199 codesys_prop_dynarr *the_codesys_prop_dynarr;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	200
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	201 enum codesys_prop_enum
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	202 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	203 CODESYS_PROP_ALL_OK,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	204 CODESYS_PROP_ISO2022,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	205 CODESYS_PROP_CCL
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	206 };
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	207
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	208
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	209 /************************************************************************/
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	210 /* Coding system functions */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	211 /************************************************************************/
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	212
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	213 static Lisp_Object mark_coding_system (Lisp_Object, void (*) (Lisp_Object));
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	214 static void print_coding_system (Lisp_Object, Lisp_Object, int);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	215 static void finalize_coding_system (void *header, int for_disksave);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	216
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	217 DEFINE_LRECORD_IMPLEMENTATION ("coding-system", coding_system,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	218 mark_coding_system, print_coding_system,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	219 finalize_coding_system,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	220 0, 0, struct Lisp_Coding_System);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	221
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	222 static Lisp_Object
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	223 mark_coding_system (Lisp_Object obj, void (*markobj) (Lisp_Object))
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	224 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	225 struct Lisp_Coding_System *codesys = XCODING_SYSTEM (obj);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	226 int i;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	227
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	228 (markobj) (CODING_SYSTEM_NAME (codesys));
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	229 (markobj) (CODING_SYSTEM_DOC_STRING (codesys));
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	230 (markobj) (CODING_SYSTEM_MNEMONIC (codesys));
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	231 (markobj) (CODING_SYSTEM_EOL_LF (codesys));
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	232 (markobj) (CODING_SYSTEM_EOL_CRLF (codesys));
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	233 (markobj) (CODING_SYSTEM_EOL_CR (codesys));
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	234 switch (CODING_SYSTEM_TYPE (codesys))
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	235 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	236 case CODESYS_ISO2022:
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	237 for (i = 0; i < 4; i++)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	238 (markobj) (CODING_SYSTEM_ISO2022_INITIAL_CHARSET (codesys, i));
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	239 if (codesys->iso2022.input_conv)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	240 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	241 for (i = 0; i < Dynarr_length (codesys->iso2022.input_conv); i++)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	242 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	243 struct charset_conversion_spec *ccs =
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	244 Dynarr_atp (codesys->iso2022.input_conv, i);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	245 (markobj) (ccs->from_charset);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	246 (markobj) (ccs->to_charset);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	247 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	248 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	249 if (codesys->iso2022.output_conv)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	250 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	251 for (i = 0; i < Dynarr_length (codesys->iso2022.output_conv); i++)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	252 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	253 struct charset_conversion_spec *ccs =
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	254 Dynarr_atp (codesys->iso2022.output_conv, i);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	255 (markobj) (ccs->from_charset);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	256 (markobj) (ccs->to_charset);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	257 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	258 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	259 break;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	260
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	261 case CODESYS_CCL:
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	262 (markobj) (CODING_SYSTEM_CCL_DECODE (codesys));
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	263 (markobj) (CODING_SYSTEM_CCL_ENCODE (codesys));
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	264 break;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	265 default:
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	266 break;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	267 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	268
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	269 (markobj) (CODING_SYSTEM_PRE_WRITE_CONVERSION (codesys));
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	270 return CODING_SYSTEM_POST_READ_CONVERSION (codesys);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	271 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	272
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	273 static void
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	274 print_coding_system (Lisp_Object obj, Lisp_Object printcharfun,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	275 int escapeflag)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	276 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	277 struct Lisp_Coding_System *c = XCODING_SYSTEM (obj);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	278 if (print_readably)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	279 error ("printing unreadable object #<coding_system 0x%x>",
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	280 c->header.uid);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	281
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	282 write_c_string ("#<coding_system ", printcharfun);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	283 print_internal (c->name, printcharfun, 1);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	284 write_c_string (">", printcharfun);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	285 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	286
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	287 static void
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	288 finalize_coding_system (void *header, int for_disksave)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	289 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	290 struct Lisp_Coding_System c = (struct Lisp_Coding_System ) header;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	291 /* Since coding systems never go away, this function is not
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	292 necessary. But it would be necessary if we changed things
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	293 so that coding systems could go away. */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	294 if (!for_disksave) /* see comment in lstream.c */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	295 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	296 switch (CODING_SYSTEM_TYPE (c))
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	297 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	298 case CODESYS_ISO2022:
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	299 if (c->iso2022.input_conv)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	300 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	301 Dynarr_free (c->iso2022.input_conv);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	302 c->iso2022.input_conv = 0;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	303 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	304 if (c->iso2022.output_conv)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	305 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	306 Dynarr_free (c->iso2022.output_conv);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	307 c->iso2022.output_conv = 0;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	308 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	309 break;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	310
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	311 default:
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	312 break;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	313 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	314 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	315 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	316
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	317 static int
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	318 symbol_to_eol_type (Lisp_Object symbol)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	319 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	320 CHECK_SYMBOL (symbol);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	321 if (NILP (symbol)) return EOL_AUTODETECT;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	322 else if (EQ (symbol, Qlf)) return EOL_LF;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	323 else if (EQ (symbol, Qcrlf)) return EOL_CRLF;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	324 else if (EQ (symbol, Qcr)) return EOL_CR;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	325 else
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	326 signal_simple_error ("Unrecognized eol type", symbol);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	327
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	328 return 0; /* not reached */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	329 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	330
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	331 static Lisp_Object
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	332 eol_type_to_symbol (int eol_type)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	333 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	334 switch (eol_type)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	335 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	336 case EOL_LF: return Qlf;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	337 case EOL_CRLF: return Qcrlf;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	338 case EOL_CR: return Qcr;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	339 case EOL_AUTODETECT: return Qnil;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	340 default: abort ();
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	341 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	342
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	343 return Qnil; /* not reached */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	344 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	345
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	346 static void
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	347 setup_eol_coding_systems (struct Lisp_Coding_System *codesys)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	348 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	349 Lisp_Object codesys_obj = Qnil;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	350 int len = string_length (XSYMBOL (CODING_SYSTEM_NAME (codesys))->name);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	351 char codesys_name = (char ) alloca (len + 7);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	352 Lisp_Object codesys_name_sym, sub_codesys_obj;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	353
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	354 /* kludge */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	355
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	356 XSETCODING_SYSTEM (codesys_obj, codesys);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	357
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	358 memcpy (codesys_name,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	359 string_data (XSYMBOL (CODING_SYSTEM_NAME (codesys))->name), len);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	360
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	361 #define DEFINE_SUB_CODESYS(op_sys, Type) do { \
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	362 strcpy (codesys_name + len, "-" op_sys); \
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	363 codesys_name_sym = intern (codesys_name); \
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	364 sub_codesys_obj = Fcopy_coding_system (codesys_obj, codesys_name_sym); \
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	365 XCODING_SYSTEM_EOL_TYPE (sub_codesys_obj) = Type; \
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	366 CODING_SYSTEM_##Type (codesys) = sub_codesys_obj; \
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	367 } while (0)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	368
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	369 DEFINE_SUB_CODESYS("unix", EOL_LF);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	370 DEFINE_SUB_CODESYS("dos", EOL_CRLF);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	371 DEFINE_SUB_CODESYS("mac", EOL_CR);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	372 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	373
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	374 DEFUN ("coding-system-p", Fcoding_system_p, 1, 1, 0, /*
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	375 T if OBJECT is a coding system.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	376 A coding system is an object that defines how text containing multiple
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	377 character sets is encoded into a stream of (typically 8-bit) bytes.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	378 The coding system is used to decode the stream into a series of
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	379 characters (which may be from multiple charsets) when the text is read
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	380 from a file or process, and is used to encode the text back into the
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	381 same format when it is written out to a file or process.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	382
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	383 For example, many ISO2022-compliant coding systems (such as Compound
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	384 Text, which is used for inter-client data under the X Window System)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	385 use escape sequences to switch between different charsets -- Japanese
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	386 Kanji, for example, is invoked with \"ESC $ ( B\"; ASCII is invoked
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	387 with \"ESC ( B\"; and Cyrillic is invoked with \"ESC - L\". See
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	388 `make-coding-system' for more information.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	389
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	390 Coding systems are normally identified using a symbol, and the
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	391 symbol is accepted in place of the actual coding system object whenever
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	392 a coding system is called for. (This is similar to how faces work.)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	393 */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	394 (object))
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	395 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	396 return CODING_SYSTEMP (object) ? Qt : Qnil;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	397 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	398
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	399 DEFUN ("find-coding-system", Ffind_coding_system, 1, 1, 0, /*
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	400 Retrieve the coding system of the given name.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	401
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	402 If CODING-SYSTEM-OR-NAME is a coding-system object, it is simply
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	403 returned. Otherwise, CODING-SYSTEM-OR-NAME should be a symbol.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	404 If there is no such coding system, nil is returned. Otherwise the
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	405 associated coding system object is returned.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	406 */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	407 (coding_system_or_name))
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	408 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	409 if (NILP (coding_system_or_name))
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	410 coding_system_or_name = Qbinary;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	411 if (CODING_SYSTEMP (coding_system_or_name))
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	412 return coding_system_or_name;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	413 CHECK_SYMBOL (coding_system_or_name);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	414
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	415 return Fgethash (coding_system_or_name, Vcoding_system_hashtable, Qnil);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	416 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	417
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	418 DEFUN ("get-coding-system", Fget_coding_system, 1, 1, 0, /*
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	419 Retrieve the coding system of the given name.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	420 Same as `find-coding-system' except that if there is no such
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	421 coding system, an error is signaled instead of returning nil.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	422 */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	423 (name))
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	424 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	425 Lisp_Object coding_system = Ffind_coding_system (name);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	426
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	427 if (NILP (coding_system))
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	428 signal_simple_error ("No such coding system", name);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	429 return coding_system;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	430 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	431
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	432 /* We store the coding systems in hash tables with the names as the key and the
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	433 actual coding system object as the value. Occasionally we need to use them
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	434 in a list format. These routines provide us with that. */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	435 struct coding_system_list_closure
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	436 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	437 Lisp_Object *coding_system_list;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	438 };
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	439
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	440 static void
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	441 add_coding_system_to_list_mapper (CONST void hash_key, void hash_contents,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	442 void *coding_system_list_closure)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	443 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	444 /* This function can GC */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	445 Lisp_Object key, contents;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	446 Lisp_Object *coding_system_list;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	447 struct coding_system_list_closure *chcl = coding_system_list_closure;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	448 CVOID_TO_LISP (key, hash_key);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	449 VOID_TO_LISP (contents, hash_contents);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	450 coding_system_list = chcl->coding_system_list;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	451
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	452 *coding_system_list = Fcons (XCODING_SYSTEM (contents)->name,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	453 *coding_system_list);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	454 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	455
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	456 DEFUN ("coding-system-list", Fcoding_system_list, 0, 0, 0, /*
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	457 Return a list of the names of all defined coding systems.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	458 */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	459 ())
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	460 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	461 Lisp_Object coding_system_list = Qnil;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	462 struct gcpro gcpro1;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	463 struct coding_system_list_closure coding_system_list_closure;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	464
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	465 GCPRO1 (coding_system_list);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	466 coding_system_list_closure.coding_system_list = &coding_system_list;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	467 elisp_maphash (add_coding_system_to_list_mapper, Vcoding_system_hashtable,
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	468 &coding_system_list_closure);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	469 UNGCPRO;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	470
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	471 return coding_system_list;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	472 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	473
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	474 DEFUN ("coding-system-name", Fcoding_system_name, 1, 1, 0, /*
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	475 Return the name of the given coding system.
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	476 */
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	477 (coding_system))
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	478 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	479 coding_system = Fget_coding_system (coding_system);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	480 return (XCODING_SYSTEM_NAME (coding_system));
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	481 }
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	482
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	483 static struct Lisp_Coding_System *
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	484 allocate_coding_system (int type, Lisp_Object name)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	485 {
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	486 struct Lisp_Coding_System *codesys;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	487
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	488 codesys = (struct Lisp_Coding_System *)
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	489 alloc_lcrecord (sizeof (struct Lisp_Coding_System), lrecord_coding_system);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	490
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	491 zero_lcrecord (codesys);
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	492 CODING_SYSTEM_PRE_WRITE_CONVERSION (codesys) = Qnil;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	493 CODING_SYSTEM_POST_READ_CONVERSION (codesys) = Qnil;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	494 CODING_SYSTEM_EOL_TYPE (codesys) = EOL_AUTODETECT;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	495 CODING_SYSTEM_EOL_CRLF (codesys) = Qnil;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	496 CODING_SYSTEM_EOL_CR (codesys) = Qnil;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	497 CODING_SYSTEM_EOL_LF (codesys) = Qnil;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	498 CODING_SYSTEM_TYPE (codesys) = type;
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	499
131b0175ea99 Import from CVS: tag r20-0b30 cvs parents: diff changeset	500 if (type == CODESYS_ISO2022)

70

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1 /* Code conversion functions.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

5 This file is part of XEmacs.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

6

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

7 XEmacs is free software; you can redistribute it and/or modify it

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

8 under the terms of the GNU General Public License as published by the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

9 Free Software Foundation; either version 2, or (at your option) any

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

10 later version.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

11

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

12 XEmacs is distributed in the hope that it will be useful, but WITHOUT

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

13 ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

14 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

15 for more details.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

16

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

17 You should have received a copy of the GNU General Public License

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

18 along with XEmacs; see the file COPYING. If not, write to

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

19 the Free Software Foundation, Inc., 59 Temple Place - Suite 330,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

20 Boston, MA 02111-1307, USA. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

21

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

22 /* Synched up with: Mule 2.3. Not in FSF. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

23

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

24 /* Rewritten by Ben Wing <wing@666.com>. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

25

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

26 #include <config.h>

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

27 #include "lisp.h"

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

28

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

29 #include "buffer.h"

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

30 #include "elhash.h"

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

31 #include "insdel.h"

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

32 #include "lstream.h"

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

33 #include "mule-coding.h"

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

34

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

35 Lisp_Object Qfile_coding_system, Qcoding_system_error;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

36

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

37 Lisp_Object Vkeyboard_coding_system;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

38 Lisp_Object Vterminal_coding_system;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

39 Lisp_Object Vprocess_input_coding_system;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

40 Lisp_Object Vprocess_output_coding_system;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

41 Lisp_Object Vpathname_coding_system;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

42

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

43 /* Table of symbols identifying each coding category. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

44 Lisp_Object coding_category_symbol[CODING_CATEGORY_LAST + 1];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

45

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

46 /* Coding system currently associated with each coding category. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

47 Lisp_Object coding_category_system[CODING_CATEGORY_LAST + 1];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

48

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

49 /* Table of all coding categories in decreasing order of priority.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

50 This describes a permutation of the possible coding categories. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

51 int coding_category_by_priority[CODING_CATEGORY_LAST + 1];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

52

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

53 Lisp_Object Qcoding_system_p;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

54

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

55 Lisp_Object Qbig5, Qshift_jis, Qno_conversion, Qccl, Qiso2022;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

56 /* Qinternal in general.c */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

57

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

58 Lisp_Object Qmnemonic, Qeol_type;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

59 Lisp_Object Qcr, Qcrlf, Qlf;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

60 Lisp_Object Qeol_cr, Qeol_crlf, Qeol_lf;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

61 Lisp_Object Qpost_read_conversion;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

62 Lisp_Object Qpre_write_conversion;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

63

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

64 Lisp_Object Qcharset_g0, Qcharset_g1, Qcharset_g2, Qcharset_g3;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

65 Lisp_Object Qforce_g0_on_output, Qforce_g1_on_output;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

66 Lisp_Object Qforce_g2_on_output, Qforce_g3_on_output;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

67 Lisp_Object Qshort, Qno_ascii_eol, Qno_ascii_cntl, Qseven, Qlock_shift;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

68 Lisp_Object Qno_iso6429, Qescape_quoted;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

69 Lisp_Object Qinput_charset_conversion, Qoutput_charset_conversion;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

70

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

71 Lisp_Object Qencode, Qdecode;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

72

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

73 Lisp_Object Qctext;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

74

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

75 Lisp_Object Vcoding_system_hashtable;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

76

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

77 /* Additional information used by the ISO2022 decoder and detector. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

78 struct iso2022_decoder

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

79 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

80 /* CHARSET holds the character sets currently assigned to the G0

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

81 through G3 variables. It is initialized from the array

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

82 INITIAL_CHARSET in CODESYS. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

83 Lisp_Object charset[4];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

84

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

85 /* Which registers are currently invoked into the left (GL) and

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

86 right (GR) halves of the 8-bit encoding space? */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

87 int register_left, register_right;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

88

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

89 /* ISO_ESC holds a value indicating part of an escape sequence

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

90 that has already been seen. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

91 enum iso_esc_flag esc;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

92

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

93 /* This records the bytes we've seen so far in an escape sequence,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

94 in case the sequence is invalid (we spit out the bytes unchanged). */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

95 unsigned char esc_bytes[8];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

96

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

97 /* Index for next byte to store in ISO escape sequence. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

98 int esc_bytes_index;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

99

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

100 /* Stuff seen so far when composing a string. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

101 unsigned_char_dynarr *composite_chars;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

102

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

103 /* If we saw an invalid designation sequence for a particular

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

104 register, we flag it here and switch to ASCII. The next time we

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

105 see a valid designation for this register, we turn off the flag

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

106 and do the designation normally, but pretend the sequence was

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

107 invalid. The effect of all this is that (most of the time) the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

108 escape sequences for both the switch to the unknown charset, and

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

109 the switch back to the known charset, get inserted literally into

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

110 the buffer and saved out as such. The hope is that we can

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

111 preserve the escape sequences so that the resulting written out

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

112 file makes sense. If we don't do any of this, the designation

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

113 to the invalid charset will be preserved but that switch back

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

114 to the known charset will probably get eaten because it was

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

115 the same charset that was already present in the register. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

116 unsigned char invalid_designated[4];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

117

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

118 /* We try to do similar things as above for direction-switching

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

119 sequences. If we encountered a direction switch while an

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

120 invalid designation was present, or an invalid designation

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

121 just after a direction switch (i.e. no valid designation

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

122 encountered yet), we insert the direction-switch escape

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

123 sequence literally into the output stream, and later on

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

124 insert the corresponding direction-restoring escape sequence

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

125 literally also. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

126 int switched_dir_and_no_valid_charset_yet :1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

127 int invalid_switch_dir :1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

128

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

129 /* Tells the decoder to output the escape sequence literally

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

130 even though it was valid. Used in the games we play to

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

131 avoid lossage when we encounter invalid designations. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

132 int output_literally :1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

133 /* We encountered a direction switch followed by an invalid

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

134 designation. We didn't output the direction switch

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

135 literally because we didn't know about the invalid designation;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

136 but we have to do so now. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

137 int output_direction_sequence :1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

138 };

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

139

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

140 Lisp_Object Fcopy_coding_system (Lisp_Object old_coding_system,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

141 Lisp_Object new_name);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

142 struct detection_state;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

143 static int detect_coding_shift_jis (struct detection_state *st,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

144 CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

145 unsigned int n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

146 static void decode_coding_shift_jis (Lstream *decoding,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

147 CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

148 unsigned_char_dynarr *dst,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

149 unsigned int n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

150 static void encode_coding_shift_jis (Lstream *encoding,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

151 CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

152 unsigned_char_dynarr *dst,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

153 unsigned int n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

154 static int detect_coding_big5 (struct detection_state *st,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

155 CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

156 unsigned int n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

157 static void decode_coding_big5 (Lstream *decoding,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

158 CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

159 unsigned_char_dynarr *dst, unsigned int n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

160 static void encode_coding_big5 (Lstream *encoding,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

161 CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

162 unsigned_char_dynarr *dst, unsigned int n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

163 static int postprocess_iso2022_mask (int mask);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

164 static void reset_iso2022 (Lisp_Object coding_system,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

165 struct iso2022_decoder *iso);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

166 static int detect_coding_iso2022 (struct detection_state *st,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

167 CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

168 unsigned int n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

169 static void decode_coding_iso2022 (Lstream *decoding,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

170 CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

171 unsigned_char_dynarr *dst, unsigned int n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

172 static void encode_coding_iso2022 (Lstream *encoding,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

173 CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

174 unsigned_char_dynarr *dst, unsigned int n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

175 static void decode_coding_no_conversion (Lstream *decoding,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

176 CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

177 unsigned_char_dynarr *dst,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

178 unsigned int n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

179 static void encode_coding_no_conversion (Lstream *encoding,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

180 CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

181 unsigned_char_dynarr *dst,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

182 unsigned int n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

183 static void mule_decode (Lstream *decoding, CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

184 unsigned_char_dynarr *dst, unsigned int n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

185 static void mule_encode (Lstream *encoding, CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

186 unsigned_char_dynarr *dst, unsigned int n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

187

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

188 struct codesys_prop

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

189 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

190 Lisp_Object sym;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

191 int prop_type;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

192 };

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

193

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

194 typedef struct codesys_prop_dynarr_type

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

195 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

196 Dynarr_declare (struct codesys_prop);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

197 } codesys_prop_dynarr;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

198

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

199 codesys_prop_dynarr *the_codesys_prop_dynarr;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

200

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

201 enum codesys_prop_enum

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

202 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

203 CODESYS_PROP_ALL_OK,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

204 CODESYS_PROP_ISO2022,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

205 CODESYS_PROP_CCL

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

206 };

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

207

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

208

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

209 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

210 /* Coding system functions */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

211 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

212

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

213 static Lisp_Object mark_coding_system (Lisp_Object, void (*) (Lisp_Object));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

214 static void print_coding_system (Lisp_Object, Lisp_Object, int);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

215 static void finalize_coding_system (void *header, int for_disksave);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

216

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

217 DEFINE_LRECORD_IMPLEMENTATION ("coding-system", coding_system,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

218 mark_coding_system, print_coding_system,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

219 finalize_coding_system,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

220 0, 0, struct Lisp_Coding_System);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

221

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

222 static Lisp_Object

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

223 mark_coding_system (Lisp_Object obj, void (*markobj) (Lisp_Object))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

224 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

225 struct Lisp_Coding_System *codesys = XCODING_SYSTEM (obj);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

226 int i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

227

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

228 (markobj) (CODING_SYSTEM_NAME (codesys));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

229 (markobj) (CODING_SYSTEM_DOC_STRING (codesys));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

230 (markobj) (CODING_SYSTEM_MNEMONIC (codesys));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

231 (markobj) (CODING_SYSTEM_EOL_LF (codesys));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

232 (markobj) (CODING_SYSTEM_EOL_CRLF (codesys));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

233 (markobj) (CODING_SYSTEM_EOL_CR (codesys));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

234 switch (CODING_SYSTEM_TYPE (codesys))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

235 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

236 case CODESYS_ISO2022:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

237 for (i = 0; i < 4; i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

238 (markobj) (CODING_SYSTEM_ISO2022_INITIAL_CHARSET (codesys, i));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

239 if (codesys->iso2022.input_conv)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

240 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

241 for (i = 0; i < Dynarr_length (codesys->iso2022.input_conv); i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

242 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

243 struct charset_conversion_spec *ccs =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

244 Dynarr_atp (codesys->iso2022.input_conv, i);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

245 (markobj) (ccs->from_charset);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

246 (markobj) (ccs->to_charset);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

247 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

248 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

249 if (codesys->iso2022.output_conv)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

250 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

251 for (i = 0; i < Dynarr_length (codesys->iso2022.output_conv); i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

252 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

253 struct charset_conversion_spec *ccs =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

254 Dynarr_atp (codesys->iso2022.output_conv, i);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

255 (markobj) (ccs->from_charset);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

256 (markobj) (ccs->to_charset);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

257 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

258 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

259 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

260

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

261 case CODESYS_CCL:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

262 (markobj) (CODING_SYSTEM_CCL_DECODE (codesys));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

263 (markobj) (CODING_SYSTEM_CCL_ENCODE (codesys));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

264 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

265 default:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

266 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

267 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

268

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

269 (markobj) (CODING_SYSTEM_PRE_WRITE_CONVERSION (codesys));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

270 return CODING_SYSTEM_POST_READ_CONVERSION (codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

271 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

272

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

273 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

274 print_coding_system (Lisp_Object obj, Lisp_Object printcharfun,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

275 int escapeflag)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

276 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

277 struct Lisp_Coding_System *c = XCODING_SYSTEM (obj);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

278 if (print_readably)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

279 error ("printing unreadable object #<coding_system 0x%x>",

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

280 c->header.uid);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

281

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

282 write_c_string ("#<coding_system ", printcharfun);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

283 print_internal (c->name, printcharfun, 1);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

284 write_c_string (">", printcharfun);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

285 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

286

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

287 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

288 finalize_coding_system (void *header, int for_disksave)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

289 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

290 struct Lisp_Coding_System *c = (struct Lisp_Coding_System *) header;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

291 /* Since coding systems never go away, this function is not

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

292 necessary. But it would be necessary if we changed things

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

293 so that coding systems could go away. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

294 if (!for_disksave) /* see comment in lstream.c */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

295 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

296 switch (CODING_SYSTEM_TYPE (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

297 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

298 case CODESYS_ISO2022:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

299 if (c->iso2022.input_conv)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

300 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

301 Dynarr_free (c->iso2022.input_conv);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

302 c->iso2022.input_conv = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

303 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

304 if (c->iso2022.output_conv)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

305 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

306 Dynarr_free (c->iso2022.output_conv);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

307 c->iso2022.output_conv = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

308 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

309 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

310

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

311 default:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

312 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

313 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

314 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

315 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

316

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

317 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

318 symbol_to_eol_type (Lisp_Object symbol)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

319 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

320 CHECK_SYMBOL (symbol);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

321 if (NILP (symbol)) return EOL_AUTODETECT;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

322 else if (EQ (symbol, Qlf)) return EOL_LF;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

323 else if (EQ (symbol, Qcrlf)) return EOL_CRLF;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

324 else if (EQ (symbol, Qcr)) return EOL_CR;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

325 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

326 signal_simple_error ("Unrecognized eol type", symbol);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

327

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

328 return 0; /* not reached */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

329 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

330

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

331 static Lisp_Object

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

332 eol_type_to_symbol (int eol_type)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

333 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

334 switch (eol_type)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

335 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

336 case EOL_LF: return Qlf;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

337 case EOL_CRLF: return Qcrlf;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

338 case EOL_CR: return Qcr;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

339 case EOL_AUTODETECT: return Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

340 default: abort ();

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

341 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

342

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

343 return Qnil; /* not reached */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

344 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

345

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

346 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

347 setup_eol_coding_systems (struct Lisp_Coding_System *codesys)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

348 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

349 Lisp_Object codesys_obj = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

350 int len = string_length (XSYMBOL (CODING_SYSTEM_NAME (codesys))->name);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

351 char *codesys_name = (char *) alloca (len + 7);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

352 Lisp_Object codesys_name_sym, sub_codesys_obj;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

353

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

354 /* kludge */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

355

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

356 XSETCODING_SYSTEM (codesys_obj, codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

357

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

358 memcpy (codesys_name,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

359 string_data (XSYMBOL (CODING_SYSTEM_NAME (codesys))->name), len);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

360

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

361 #define DEFINE_SUB_CODESYS(op_sys, Type) do { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

362 strcpy (codesys_name + len, "-" op_sys); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

363 codesys_name_sym = intern (codesys_name); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

364 sub_codesys_obj = Fcopy_coding_system (codesys_obj, codesys_name_sym); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

365 XCODING_SYSTEM_EOL_TYPE (sub_codesys_obj) = Type; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

366 CODING_SYSTEM_##Type (codesys) = sub_codesys_obj; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

367 } while (0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

368

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

369 DEFINE_SUB_CODESYS("unix", EOL_LF);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

370 DEFINE_SUB_CODESYS("dos", EOL_CRLF);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

371 DEFINE_SUB_CODESYS("mac", EOL_CR);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

372 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

373

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

374 DEFUN ("coding-system-p", Fcoding_system_p, 1, 1, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

375 T if OBJECT is a coding system.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

376 A coding system is an object that defines how text containing multiple

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

377 character sets is encoded into a stream of (typically 8-bit) bytes.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

378 The coding system is used to decode the stream into a series of

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

379 characters (which may be from multiple charsets) when the text is read

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

380 from a file or process, and is used to encode the text back into the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

381 same format when it is written out to a file or process.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

382

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

383 For example, many ISO2022-compliant coding systems (such as Compound

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

384 Text, which is used for inter-client data under the X Window System)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

385 use escape sequences to switch between different charsets -- Japanese

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

386 Kanji, for example, is invoked with \"ESC $ ( B\"; ASCII is invoked

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

387 with \"ESC ( B\"; and Cyrillic is invoked with \"ESC - L\". See

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

388 `make-coding-system' for more information.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

389

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

390 Coding systems are normally identified using a symbol, and the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

391 symbol is accepted in place of the actual coding system object whenever

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

392 a coding system is called for. (This is similar to how faces work.)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

393 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

394 (object))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

395 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

396 return CODING_SYSTEMP (object) ? Qt : Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

397 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

398

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

399 DEFUN ("find-coding-system", Ffind_coding_system, 1, 1, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

400 Retrieve the coding system of the given name.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

401

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

402 If CODING-SYSTEM-OR-NAME is a coding-system object, it is simply

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

403 returned. Otherwise, CODING-SYSTEM-OR-NAME should be a symbol.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

404 If there is no such coding system, nil is returned. Otherwise the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

405 associated coding system object is returned.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

406 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

407 (coding_system_or_name))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

408 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

409 if (NILP (coding_system_or_name))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

410 coding_system_or_name = Qbinary;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

411 if (CODING_SYSTEMP (coding_system_or_name))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

412 return coding_system_or_name;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

413 CHECK_SYMBOL (coding_system_or_name);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

414

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

415 return Fgethash (coding_system_or_name, Vcoding_system_hashtable, Qnil);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

416 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

417

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

418 DEFUN ("get-coding-system", Fget_coding_system, 1, 1, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

419 Retrieve the coding system of the given name.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

420 Same as `find-coding-system' except that if there is no such

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

421 coding system, an error is signaled instead of returning nil.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

422 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

423 (name))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

424 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

425 Lisp_Object coding_system = Ffind_coding_system (name);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

426

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

427 if (NILP (coding_system))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

428 signal_simple_error ("No such coding system", name);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

429 return coding_system;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

430 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

431

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

432 /* We store the coding systems in hash tables with the names as the key and the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

433 actual coding system object as the value. Occasionally we need to use them

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

434 in a list format. These routines provide us with that. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

435 struct coding_system_list_closure

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

436 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

437 Lisp_Object *coding_system_list;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

438 };

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

439

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

440 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

441 add_coding_system_to_list_mapper (CONST void *hash_key, void *hash_contents,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

442 void *coding_system_list_closure)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

443 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

444 /* This function can GC */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

445 Lisp_Object key, contents;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

446 Lisp_Object *coding_system_list;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

447 struct coding_system_list_closure *chcl = coding_system_list_closure;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

448 CVOID_TO_LISP (key, hash_key);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

449 VOID_TO_LISP (contents, hash_contents);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

450 coding_system_list = chcl->coding_system_list;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

451

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

452 *coding_system_list = Fcons (XCODING_SYSTEM (contents)->name,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

453 *coding_system_list);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

454 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

455

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

456 DEFUN ("coding-system-list", Fcoding_system_list, 0, 0, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

457 Return a list of the names of all defined coding systems.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

458 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

459 ())

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

460 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

461 Lisp_Object coding_system_list = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

462 struct gcpro gcpro1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

463 struct coding_system_list_closure coding_system_list_closure;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

464

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

465 GCPRO1 (coding_system_list);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

466 coding_system_list_closure.coding_system_list = &coding_system_list;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

467 elisp_maphash (add_coding_system_to_list_mapper, Vcoding_system_hashtable,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

468 &coding_system_list_closure);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

469 UNGCPRO;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

470

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

471 return coding_system_list;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

472 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

473

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

474 DEFUN ("coding-system-name", Fcoding_system_name, 1, 1, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

475 Return the name of the given coding system.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

476 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

477 (coding_system))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

478 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

479 coding_system = Fget_coding_system (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

480 return (XCODING_SYSTEM_NAME (coding_system));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

481 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

482

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

483 static struct Lisp_Coding_System *

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

484 allocate_coding_system (int type, Lisp_Object name)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

485 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

486 struct Lisp_Coding_System *codesys;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

487

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

488 codesys = (struct Lisp_Coding_System *)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

489 alloc_lcrecord (sizeof (struct Lisp_Coding_System), lrecord_coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

490

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

491 zero_lcrecord (codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

492 CODING_SYSTEM_PRE_WRITE_CONVERSION (codesys) = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

493 CODING_SYSTEM_POST_READ_CONVERSION (codesys) = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

494 CODING_SYSTEM_EOL_TYPE (codesys) = EOL_AUTODETECT;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

495 CODING_SYSTEM_EOL_CRLF (codesys) = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

496 CODING_SYSTEM_EOL_CR (codesys) = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

497 CODING_SYSTEM_EOL_LF (codesys) = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

498 CODING_SYSTEM_TYPE (codesys) = type;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

499

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

500 if (type == CODESYS_ISO2022)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

501 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

502 int i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

503 for (i = 0; i < 4; i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

504 CODING_SYSTEM_ISO2022_INITIAL_CHARSET (codesys, i) = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

505 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

506 else if (type == CODESYS_CCL)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

507 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

508 CODING_SYSTEM_CCL_DECODE (codesys) = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

509 CODING_SYSTEM_CCL_ENCODE (codesys) = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

510 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

511

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

512 CODING_SYSTEM_NAME (codesys) = name;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

513

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

514 return codesys;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

515 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

516

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

517 /* Given a list of charset conversion specs as specified in a Lisp

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

518 program, parse it into STORE_HERE. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

519

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

520 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

521 parse_charset_conversion_specs (charset_conversion_spec_dynarr *store_here,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

522 Lisp_Object spec_list)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

523 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

524 Lisp_Object rest;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

525

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

526 EXTERNAL_LIST_LOOP (rest, spec_list)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

527 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

528 Lisp_Object car = XCAR (rest);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

529 Lisp_Object from, to;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

530 struct charset_conversion_spec spec;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

531

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

532 if (!CONSP (car) || !CONSP (XCDR (car)) || !NILP (XCDR (XCDR (car))))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

533 signal_simple_error ("Invalid charset conversion spec", car);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

534 from = Fget_charset (XCAR (car));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

535 to = Fget_charset (XCAR (XCDR (car)));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

536 if (XCHARSET_TYPE (from) != XCHARSET_TYPE (to))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

537 signal_simple_error_2

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

538 ("Attempted conversion between different charset types",

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

539 from, to);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

540 spec.from_charset = from;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

541 spec.to_charset = to;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

542

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

543 Dynarr_add (store_here, spec);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

544 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

545 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

546

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

547 /* Given a dynarr LOAD_HERE of internally-stored charset conversion

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

548 specs, return the equivalent as the Lisp programmer would see it.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

549

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

550 If LOAD_HERE is 0, return Qnil. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

551

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

552 static Lisp_Object

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

553 unparse_charset_conversion_specs (charset_conversion_spec_dynarr *load_here)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

554 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

555 int i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

556 Lisp_Object result = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

557

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

558 if (!load_here)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

559 return Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

560 for (i = 0; i < Dynarr_length (load_here); i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

561 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

562 struct charset_conversion_spec *ccs =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

563 Dynarr_atp (load_here, i);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

564 result = Fcons (list2 (ccs->from_charset, ccs->to_charset), result);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

565 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

566

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

567 return Fnreverse (result);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

568 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

569

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

570 DEFUN ("make-coding-system", Fmake_coding_system, 2, 4, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

571 Register symbol NAME as a coding system.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

572

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

573 TYPE describes the conversion method used and should be one of

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

574

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

575 nil or 'autodetect

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

576 Automatic conversion. XEmacs attempts to detect the coding system

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

577 used in the file.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

578 'no-conversion

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

579 No conversion. Use this for binary files and such. On output,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

580 graphic characters that are not in ASCII or Latin-1 will be

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

581 replaced by a ?. (For a no-conversion-encoded buffer, these

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

582 characters will only be present if you explicitly insert them.)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

583 'shift-jis

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

584 Shift-JIS (a Japanese encoding commonly used in PC operating systems).

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

585 'iso2022

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

586 Any ISO2022-compliant encoding. Among other things, this includes

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

587 JIS (the Japanese encoding commonly used for e-mail), EUC (the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

588 standard Unix encoding for Japanese and other languages), and

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

589 Compound Text (the encoding used in X11). You can specify more

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

590 specific information about the conversion with the FLAGS argument.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

591 'big5

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

592 Big5 (the encoding commonly used for Taiwanese).

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

593 'ccl

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

594 The conversion is performed using a user-written pseudo-code

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

595 program. CCL (Code Conversion Language) is the name of this

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

596 pseudo-code.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

597 'internal

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

598 Write out or read in the raw contents of the memory representing

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

599 the buffer's text. This is primarily useful for debugging

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

600 purposes, and is only enabled when XEmacs has been compiled with

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

601 DEBUG_XEMACS defined (via the --debug configure option).

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

602 WARNING: Reading in a file using 'internal conversion can result

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

603 in an internal inconsistency in the memory representing a

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

604 buffer's text, which will produce unpredictable results and may

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

605 cause XEmacs to crash. Under normal circumstances you should

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

606 never use 'internal conversion.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

607

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

608 DOC-STRING is a string describing the coding system.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

609

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

610 PROPS is a property list, describing the specific nature of the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

611 character set. Recognized properties are:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

612

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

613 'mnemonic

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

614 String to be displayed in the modeline when this coding system is

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

615 active.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

616

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

617 'eol-type

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

618 End-of-line conversion to be used. It should be one of

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

619

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

620 nil

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

621 Automatically detect the end-of-line type (LF, CRLF,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

622 or CR). Also generate subsidiary coding systems named

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

623 `NAME-unix', `NAME-dos', and `NAME-mac', that are

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

624 identical to this coding system but have an EOL-TYPE

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

625 value of 'lf, 'crlf, and 'cr, respectively.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

626 'lf

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

627 The end of a line is marked externally using ASCII LF.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

628 Since this is also the way that XEmacs represents an

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

629 end-of-line internally, specifying this option results

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

630 in no end-of-line conversion. This is the standard

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

631 format for Unix text files.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

632 'crlf

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

633 The end of a line is marked externally using ASCII

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

634 CRLF. This is the standard format for MS-DOS text

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

635 files.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

636 'cr

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

637 The end of a line is marked externally using ASCII CR.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

638 This is the standard format for Macintosh text files.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

639 t

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

640 Automatically detect the end-of-line type but do not

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

641 generate subsidiary coding systems. (This value is

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

642 converted to nil when stored internally, and

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

643 `coding-system-property' will return nil.)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

644

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

645 'post-read-conversion

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

646 Function called after a file has been read in, to perform the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

647 decoding. Called with two arguments, BEG and END, denoting

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

648 a region of the current buffer to be decoded.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

649

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

650 'pre-write-conversion

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

651 Function called before a file is written out, to perform the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

652 encoding. Called with two arguments, BEG and END, denoting

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

653 a region of the current buffer to be encoded.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

654

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

655

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

656 The following additional properties are recognized if TYPE is 'iso2022:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

657

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

658 'charset-g0

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

659 'charset-g1

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

660 'charset-g2

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

661 'charset-g3

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

662 The character set initially designated to the G0 - G3 registers.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

663 The value should be one of

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

664

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

665 -- A charset object (designate that character set)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

666 -- nil (do not ever use this register)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

667 -- t (no character set is initially designated to

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

668 the register, but may be later on; this automatically

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

669 sets the corresponding `force-g*-on-output' property)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

670

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

671 'force-g0-on-output

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

672 'force-g1-on-output

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

673 'force-g2-on-output

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

674 'force-g2-on-output

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

675 If non-nil, send an explicit designation sequence on output before

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

676 using the specified register.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

677

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

678 'short

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

679 If non-nil, use the short forms \"ESC $ @\", \"ESC $ A\", and

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

680 \"ESC $ B\" on output in place of the full designation sequences

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

681 \"ESC $ ( @\", \"ESC $ ( A\", and \"ESC $ ( B\".

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

682

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

683 'no-ascii-eol

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

684 If non-nil, don't designate ASCII to G0 at each end of line on output.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

685 Setting this to non-nil also suppresses other state-resetting that

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

686 normally happens at the end of a line.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

687

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

688 'no-ascii-cntl

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

689 If non-nil, don't designate ASCII to G0 before control chars on output.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

690

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

691 'seven

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

692 If non-nil, use 7-bit environment on output. Otherwise, use 8-bit

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

693 environment.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

694

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

695 'lock-shift

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

696 If non-nil, use locking-shift (SO/SI) instead of single-shift

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

697 or designation by escape sequence.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

698

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

699 'no-iso6429

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

700 If non-nil, don't use ISO6429's direction specification.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

701

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

702 'escape-quoted

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

703 If non-nil, literal control characters that are the same as

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

704 the beginning of a recognized ISO2022 or ISO6429 escape sequence

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

705 (in particular, ESC (0x1B), SO (0x0E), SI (0x0F), SS2 (0x8E),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

706 SS3 (0x8F), and CSI (0x9B)) are \"quoted\" with an escape character

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

707 so that they can be properly distinguished from an escape sequence.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

708 (Note that doing this results in a non-portable encoding.) This

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

709 encoding flag is used for byte-compiled files. Note that ESC

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

710 is a good choice for a quoting character because there are no

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

711 escape sequences whose second byte is a character from the Control-0

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

712 or Control-1 character sets; this is explicitly disallowed by the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

713 ISO2022 standard.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

714

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

715 'input-charset-conversion

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

716 A list of conversion specifications, specifying conversion of

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

717 characters in one charset to another when decoding is performed.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

718 Each specification is a list of two elements: the source charset,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

719 and the destination charset.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

720

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

721 'output-charset-conversion

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

722 A list of conversion specifications, specifying conversion of

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

723 characters in one charset to another when encoding is performed.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

724 The form of each specification is the same as for

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

725 'input-charset-conversion.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

726

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

727

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

728 The following additional properties are recognized (and required)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

729 if TYPE is 'ccl:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

730

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

731 'decode

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

732 CCL program used for decoding (converting to internal format).

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

733

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

734 'encode

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

735 CCL program used for encoding (converting to external format).

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

736 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

737 (name, type, doc_string, props))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

738 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

739 struct Lisp_Coding_System *codesys;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

740 Lisp_Object rest, key, value;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

741 int ty;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

742 int need_to_setup_eol_systems = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

743

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

744 /* Convert type to constant */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

745 if (NILP (type) || EQ (type, Qautodetect)) { ty = CODESYS_AUTODETECT; }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

746 else if (EQ (type, Qshift_jis)) { ty = CODESYS_SHIFT_JIS; }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

747 else if (EQ (type, Qiso2022)) { ty = CODESYS_ISO2022; }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

748 else if (EQ (type, Qbig5)) { ty = CODESYS_BIG5; }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

749 else if (EQ (type, Qccl)) { ty = CODESYS_CCL; }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

750 else if (EQ (type, Qno_conversion)) { ty = CODESYS_NO_CONVERSION; }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

751 #ifdef DEBUG_XEMACS

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

752 else if (EQ (type, Qinternal)) { ty = CODESYS_INTERNAL; }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

753 #endif

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

754 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

755 signal_simple_error ("Invalid coding system type", type);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

756

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

757 CHECK_SYMBOL (name);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

758

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

759 codesys = allocate_coding_system (ty, name);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

760

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

761 if (NILP (doc_string))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

762 doc_string = build_string ("");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

763 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

764 CHECK_STRING (doc_string);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

765 CODING_SYSTEM_DOC_STRING (codesys) = doc_string;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

766

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

767 EXTERNAL_PROPERTY_LIST_LOOP (rest, key, value, props)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

768 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

769 if (EQ (key, Qmnemonic))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

770 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

771 if (!NILP (value))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

772 CHECK_STRING (value);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

773 CODING_SYSTEM_MNEMONIC (codesys) = value;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

774 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

775

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

776 else if (EQ (key, Qeol_type))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

777 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

778 need_to_setup_eol_systems = NILP (value);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

779 if (EQ (value, Qt))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

780 value = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

781 CODING_SYSTEM_EOL_TYPE (codesys) = symbol_to_eol_type (value);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

782 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

783

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

784 else if (EQ (key, Qpost_read_conversion)) CODING_SYSTEM_POST_READ_CONVERSION (codesys) = value;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

785 else if (EQ (key, Qpre_write_conversion)) CODING_SYSTEM_PRE_WRITE_CONVERSION (codesys) = value;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

786 else if (ty == CODESYS_ISO2022)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

787 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

788 #define FROB_INITIAL_CHARSET(charset_num) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

789 CODING_SYSTEM_ISO2022_INITIAL_CHARSET (codesys, charset_num) = \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

790 ((EQ (value, Qt) || EQ (value, Qnil)) ? value : Fget_charset (value))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

791

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

792 if (EQ (key, Qcharset_g0)) FROB_INITIAL_CHARSET (0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

793 else if (EQ (key, Qcharset_g1)) FROB_INITIAL_CHARSET (1);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

794 else if (EQ (key, Qcharset_g2)) FROB_INITIAL_CHARSET (2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

795 else if (EQ (key, Qcharset_g3)) FROB_INITIAL_CHARSET (3);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

796

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

797 #define FROB_FORCE_CHARSET(charset_num) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

798 CODING_SYSTEM_ISO2022_FORCE_CHARSET_ON_OUTPUT (codesys, charset_num) = !NILP (value)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

799

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

800 else if (EQ (key, Qforce_g0_on_output)) FROB_FORCE_CHARSET (0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

801 else if (EQ (key, Qforce_g1_on_output)) FROB_FORCE_CHARSET (1);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

802 else if (EQ (key, Qforce_g2_on_output)) FROB_FORCE_CHARSET (2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

803 else if (EQ (key, Qforce_g3_on_output)) FROB_FORCE_CHARSET (3);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

804

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

805 #define FROB_BOOLEAN_PROPERTY(prop) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

806 CODING_SYSTEM_ISO2022_##prop (codesys) = !NILP (value)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

807

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

808 else if (EQ (key, Qshort)) FROB_BOOLEAN_PROPERTY (SHORT);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

809 else if (EQ (key, Qno_ascii_eol)) FROB_BOOLEAN_PROPERTY (NO_ASCII_EOL);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

810 else if (EQ (key, Qno_ascii_cntl)) FROB_BOOLEAN_PROPERTY (NO_ASCII_CNTL);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

811 else if (EQ (key, Qseven)) FROB_BOOLEAN_PROPERTY (SEVEN);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

812 else if (EQ (key, Qlock_shift)) FROB_BOOLEAN_PROPERTY (LOCK_SHIFT);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

813 else if (EQ (key, Qno_iso6429)) FROB_BOOLEAN_PROPERTY (NO_ISO6429);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

814 else if (EQ (key, Qescape_quoted)) FROB_BOOLEAN_PROPERTY (ESCAPE_QUOTED);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

815

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

816 else if (EQ (key, Qinput_charset_conversion))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

817 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

818 codesys->iso2022.input_conv =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

819 Dynarr_new (struct charset_conversion_spec);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

820 parse_charset_conversion_specs (codesys->iso2022.input_conv,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

821 value);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

822 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

823 else if (EQ (key, Qoutput_charset_conversion))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

824 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

825 codesys->iso2022.output_conv =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

826 Dynarr_new (struct charset_conversion_spec);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

827 parse_charset_conversion_specs (codesys->iso2022.output_conv,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

828 value);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

829 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

830 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

831 signal_simple_error ("Unrecognized property", key);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

832 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

833 else if (EQ (type, Qccl))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

834 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

835 if (EQ (key, Qdecode))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

836 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

837 CHECK_VECTOR (value);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

838 CODING_SYSTEM_CCL_DECODE (codesys) = value;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

839 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

840 else if (EQ (key, Qencode))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

841 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

842 CHECK_VECTOR (value);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

843 CODING_SYSTEM_CCL_ENCODE (codesys) = value;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

844 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

845 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

846 signal_simple_error ("Unrecognized property", key);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

847 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

848 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

849 signal_simple_error ("Unrecognized property", key);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

850 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

851

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

852 if (need_to_setup_eol_systems)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

853 setup_eol_coding_systems (codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

854

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

855 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

856 Lisp_Object codesys_obj;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

857 XSETCODING_SYSTEM (codesys_obj, codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

858 Fputhash (name, codesys_obj, Vcoding_system_hashtable);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

859 return codesys_obj;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

860 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

861 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

862

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

863 DEFUN ("copy-coding-system", Fcopy_coding_system, 2, 2, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

864 Copy OLD-CODING-SYSTEM to NEW-NAME.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

865 If NEW-NAME does not name an existing coding system, a new one will

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

866 be created.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

867 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

868 (old_coding_system, new_name))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

869 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

870 Lisp_Object new_coding_system;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

871 old_coding_system = Fget_coding_system (old_coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

872 new_coding_system = Ffind_coding_system (new_name);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

873 if (NILP (new_coding_system))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

874 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

875 XSETCODING_SYSTEM (new_coding_system,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

876 allocate_coding_system

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

877 (XCODING_SYSTEM_TYPE (old_coding_system),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

878 new_name));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

879 Fputhash (new_name, new_coding_system, Vcoding_system_hashtable);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

880 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

881

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

882 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

883 struct Lisp_Coding_System *to = XCODING_SYSTEM (new_coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

884 struct Lisp_Coding_System *from = XCODING_SYSTEM (old_coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

885 memcpy (((char *) to ) + sizeof (to->header),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

886 ((char *) from) + sizeof (from->header),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

887 sizeof (*from) - sizeof (from->header));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

888 to->name = new_name;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

889 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

890 return new_coding_system;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

891 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

892

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

893 static Lisp_Object

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

894 subsidiary_coding_system (Lisp_Object coding_system, int eol_type)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

895 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

896 struct Lisp_Coding_System *cs = XCODING_SYSTEM (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

897 Lisp_Object new_coding_system;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

898

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

899 if (CODING_SYSTEM_EOL_TYPE (cs) != EOL_AUTODETECT)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

900 return coding_system;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

901 if (eol_type == EOL_AUTODETECT)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

902 return coding_system;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

903

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

904 switch (eol_type)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

905 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

906 case EOL_LF: new_coding_system = CODING_SYSTEM_EOL_LF (cs); break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

907 case EOL_CR: new_coding_system = CODING_SYSTEM_EOL_CR (cs); break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

908 case EOL_CRLF: new_coding_system = CODING_SYSTEM_EOL_CRLF (cs); break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

909 default: abort ();

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

910 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

911

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

912 return NILP (new_coding_system) ? coding_system : new_coding_system;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

913 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

914

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

915 DEFUN ("subsidiary-coding-system", Fsubsidiary_coding_system, 2, 2, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

916 Return the subsidiary coding system of CODING-SYSTEM with eol type EOL-TYPE.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

917 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

918 (coding_system, eol_type))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

919 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

920 coding_system = Fget_coding_system (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

921

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

922 return subsidiary_coding_system (coding_system,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

923 symbol_to_eol_type (eol_type));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

924 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

925

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

926

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

927 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

928 /* Coding system accessors */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

929 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

930

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

931 DEFUN ("coding-system-doc-string", Fcoding_system_doc_string, 1, 1, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

932 Return the doc string for CODING-SYSTEM.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

933 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

934 (coding_system))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

935 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

936 coding_system = Fget_coding_system (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

937 return XCODING_SYSTEM_DOC_STRING (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

938 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

939

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

940 DEFUN ("coding-system-type", Fcoding_system_type, 1, 1, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

941 Return the type of CODING-SYSTEM.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

942 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

943 (coding_system))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

944 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

945 switch (XCODING_SYSTEM_TYPE (Fget_coding_system (coding_system)))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

946 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

947 case CODESYS_AUTODETECT: return Qautodetect;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

948 case CODESYS_SHIFT_JIS: return Qshift_jis;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

949 case CODESYS_ISO2022: return Qiso2022;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

950 case CODESYS_BIG5: return Qbig5;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

951 case CODESYS_CCL: return Qccl;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

952 case CODESYS_NO_CONVERSION: return Qno_conversion;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

953 #ifdef DEBUG_XEMACS

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

954 case CODESYS_INTERNAL: return Qinternal;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

955 #endif

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

956 default:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

957 abort ();

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

958 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

959

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

960 return Qnil; /* not reached */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

961 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

962

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

963 DEFUN ("coding-system-property", Fcoding_system_property, 2, 2, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

964 Return the PROP property of CODING-SYSTEM.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

965 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

966 (coding_system, prop))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

967 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

968 int i, ok = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

969 enum coding_system_type type;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

970

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

971 coding_system = Fget_coding_system (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

972 CHECK_SYMBOL (prop);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

973 type = XCODING_SYSTEM_TYPE (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

974

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

975 for (i = 0; !ok && i < Dynarr_length (the_codesys_prop_dynarr); i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

976 if (EQ (Dynarr_at (the_codesys_prop_dynarr, i).sym, prop))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

977 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

978 ok = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

979 switch (Dynarr_at (the_codesys_prop_dynarr, i).prop_type)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

980 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

981 case CODESYS_PROP_ALL_OK:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

982 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

983

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

984 case CODESYS_PROP_ISO2022:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

985 if (type != CODESYS_ISO2022)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

986 signal_simple_error

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

987 ("Property only valid in ISO2022 coding systems",

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

988 prop);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

989 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

990

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

991 case CODESYS_PROP_CCL:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

992 if (type != CODESYS_CCL)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

993 signal_simple_error

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

994 ("Property only valid in CCL coding systems",

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

995 prop);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

996 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

997

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

998 default:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

999 abort ();

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1000 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1001 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1002

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1003 if (!ok)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1004 signal_simple_error ("Unrecognized property", prop);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1005

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1006 if (EQ (prop, Qname))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1007 return XCODING_SYSTEM_NAME (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1008 else if (EQ (prop, Qtype))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1009 return Fcoding_system_type (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1010 else if (EQ (prop, Qdoc_string))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1011 return XCODING_SYSTEM_DOC_STRING (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1012 else if (EQ (prop, Qmnemonic))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1013 return XCODING_SYSTEM_MNEMONIC (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1014 else if (EQ (prop, Qeol_type))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1015 return eol_type_to_symbol (XCODING_SYSTEM_EOL_TYPE (coding_system));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1016 else if (EQ (prop, Qeol_lf))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1017 return XCODING_SYSTEM_EOL_LF (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1018 else if (EQ (prop, Qeol_crlf))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1019 return XCODING_SYSTEM_EOL_CRLF (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1020 else if (EQ (prop, Qeol_cr))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1021 return XCODING_SYSTEM_EOL_CR (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1022 else if (EQ (prop, Qpost_read_conversion))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1023 return XCODING_SYSTEM_POST_READ_CONVERSION (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1024 else if (EQ (prop, Qpre_write_conversion))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1025 return XCODING_SYSTEM_PRE_WRITE_CONVERSION (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1026 else if (type == CODESYS_ISO2022)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1027 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1028 #define INITIAL_CHARSET(charset_num) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1029 (XCHARSET_NAME (XCODING_SYSTEM_ISO2022_INITIAL_CHARSET \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1030 (coding_system, charset_num)))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1031

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1032 if (EQ (prop, Qcharset_g0)) return INITIAL_CHARSET (0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1033 else if (EQ (prop, Qcharset_g1)) return INITIAL_CHARSET (1);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1034 else if (EQ (prop, Qcharset_g2)) return INITIAL_CHARSET (2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1035 else if (EQ (prop, Qcharset_g3)) return INITIAL_CHARSET (3);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1036

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1037 #define FORCE_CHARSET(charset_num) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1038 (XCODING_SYSTEM_ISO2022_FORCE_CHARSET_ON_OUTPUT \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1039 (coding_system, charset_num) ? Qt : Qnil)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1040

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1041 else if (EQ (prop, Qforce_g0_on_output)) return FORCE_CHARSET (0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1042 else if (EQ (prop, Qforce_g1_on_output)) return FORCE_CHARSET (1);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1043 else if (EQ (prop, Qforce_g2_on_output)) return FORCE_CHARSET (2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1044 else if (EQ (prop, Qforce_g3_on_output)) return FORCE_CHARSET (3);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1045

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1046 #define LISP_BOOLEAN(prop) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1047 (XCODING_SYSTEM_ISO2022_##prop (coding_system) ? Qt : Qnil)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1048

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1049 else if (EQ (prop, Qshort)) return LISP_BOOLEAN (SHORT);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1050 else if (EQ (prop, Qno_ascii_eol)) return LISP_BOOLEAN (NO_ASCII_EOL);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1051 else if (EQ (prop, Qno_ascii_cntl)) return LISP_BOOLEAN (NO_ASCII_CNTL);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1052 else if (EQ (prop, Qseven)) return LISP_BOOLEAN (SEVEN);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1053 else if (EQ (prop, Qlock_shift)) return LISP_BOOLEAN (LOCK_SHIFT);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1054 else if (EQ (prop, Qno_iso6429)) return LISP_BOOLEAN (NO_ISO6429);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1055 else if (EQ (prop, Qescape_quoted)) return LISP_BOOLEAN (ESCAPE_QUOTED);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1056

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1057 else if (EQ (prop, Qinput_charset_conversion))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1058 return

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1059 unparse_charset_conversion_specs

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1060 (XCODING_SYSTEM (coding_system)->iso2022.input_conv);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1061 else if (EQ (prop, Qoutput_charset_conversion))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1062 return

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1063 unparse_charset_conversion_specs

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1064 (XCODING_SYSTEM (coding_system)->iso2022.output_conv);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1065 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1066 abort ();

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1067 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1068 else if (type == CODESYS_CCL)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1069 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1070 if (EQ (prop, Qdecode))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1071 return XCODING_SYSTEM_CCL_DECODE (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1072 else if (EQ (prop, Qencode))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1073 return XCODING_SYSTEM_CCL_ENCODE (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1074 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1075 abort ();

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1076 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1077 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1078 abort ();

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1079

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1080 return Qnil; /* not reached */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1081 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1082

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1083

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1084 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1085 /* Coding category functions */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1086 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1087

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1088 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1089 decode_coding_category (Lisp_Object symbol)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1090 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1091 int i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1092

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1093 CHECK_SYMBOL (symbol);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1094 for (i = 0; i <= CODING_CATEGORY_LAST; i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1095 if (EQ (coding_category_symbol[i], symbol))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1096 return i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1097

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1098 signal_simple_error ("Unrecognized coding category", symbol);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1099 return 0; /* not reached */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1100 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1101

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1102 DEFUN ("coding-category-list", Fcoding_category_list, 0, 0, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1103 Return a list of all recognized coding categories.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1104 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1105 ())

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1106 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1107 int i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1108 Lisp_Object list = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1109

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1110 for (i = CODING_CATEGORY_LAST; i >= 0; i--)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1111 list = Fcons (coding_category_symbol[i], list);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1112 return list;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1113 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1114

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1115 DEFUN ("set-coding-priority-list", Fset_coding_priority_list, 1, 1, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1116 Change the priority order of the coding categories.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1117 LIST should be list of coding categories, in descending order of

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1118 priority. Unspecified coding categories will be lower in priority

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1119 than all specified ones, in the same relative order they were in

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1120 previously.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1121 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1122 (list))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1123 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1124 int category_to_priority[CODING_CATEGORY_LAST + 1];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1125 int i, j;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1126 Lisp_Object rest;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1127

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1128 /* First generate a list that maps coding categories to priorities. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1129

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1130 for (i = 0; i <= CODING_CATEGORY_LAST; i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1131 category_to_priority[i] = -1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1132

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1133 /* Highest priority comes from the specified list. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1134 i = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1135 EXTERNAL_LIST_LOOP (rest, list)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1136 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1137 int cat = decode_coding_category (XCAR (rest));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1138

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1139 if (category_to_priority[cat] >= 0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1140 signal_simple_error ("Duplicate coding category in list", XCAR (rest));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1141 category_to_priority[cat] = i++;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1142 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1143

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1144 /* Now go through the existing categories by priority to retrieve

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1145 the categories not yet specified and preserve their priority

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1146 order. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1147 for (j = 0; j <= CODING_CATEGORY_LAST; j++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1148 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1149 int cat = coding_category_by_priority[j];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1150 if (category_to_priority[cat] < 0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1151 category_to_priority[cat] = i++;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1152 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1153

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1154 /* Now we need to construct the inverse of the mapping we just

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1155 constructed. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1156

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1157 for (i = 0; i <= CODING_CATEGORY_LAST; i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1158 coding_category_by_priority[category_to_priority[i]] = i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1159

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1160 /* Phew! That was confusing. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1161 return Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1162 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1163

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1164 DEFUN ("coding-priority-list", Fcoding_priority_list, 0, 0, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1165 Return a list of coding categories in descending order of priority.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1166 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1167 ())

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1168 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1169 int i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1170 Lisp_Object list = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1171

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1172 for (i = CODING_CATEGORY_LAST; i >= 0; i--)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1173 list = Fcons (coding_category_symbol[coding_category_by_priority[i]],

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1174 list);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1175 return list;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1176 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1177

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1178 DEFUN ("set-coding-category-system", Fset_coding_category_system, 2, 2, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1179 Change the coding system associated with a coding category.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1180 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1181 (coding_category, coding_system))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1182 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1183 int cat = decode_coding_category (coding_category);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1184

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1185 coding_system = Fget_coding_system (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1186 coding_category_system[cat] = coding_system;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1187 return Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1188 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1189

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1190 DEFUN ("coding-category-system", Fcoding_category_system, 1, 1, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1191 Return the coding system associated with a coding category.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1192 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1193 (coding_category))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1194 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1195 int cat = decode_coding_category (coding_category);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1196 Lisp_Object sys = coding_category_system[cat];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1197

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1198 if (!NILP (sys))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1199 return XCODING_SYSTEM_NAME (sys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1200 return Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1201 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1202

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1203

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1204 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1205 /* Detecting the encoding of data */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1206 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1207

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1208 struct detection_state

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1209 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1210 int eol_type;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1211 int seen_non_ascii;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1212 int mask;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1213

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1214 struct

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1215 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1216 int mask;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1217 int in_second_byte;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1218 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1219 big5;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1220

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1221 struct

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1222 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1223 int mask;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1224 int in_second_byte;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1225 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1226 shift_jis;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1227

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1228 struct

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1229 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1230 int mask;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1231 int initted;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1232 struct iso2022_decoder iso;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1233 unsigned int flags;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1234 int high_byte_count;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1235 int saw_single_shift:1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1236 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1237 iso2022;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1238

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1239 struct

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1240 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1241 int seen_anything;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1242 int just_saw_cr;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1243 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1244 eol;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1245 };

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1246

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1247 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1248 acceptable_control_char_p (int c)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1249 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1250 switch (c)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1251 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1252 /* Allow and ignore control characters that you might

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1253 reasonably see in a text file */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1254 case '\r':

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1255 case '\n':

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1256 case '\t':

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1257 case 7: /* bell */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1258 case 8: /* backspace */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1259 case 11: /* vertical tab */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1260 case 12: /* form feed */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1261 case 26: /* MS-DOS C-z junk */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1262 return 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1263 default:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1264 return 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1265 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1266 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1267

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1268 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1269 mask_has_at_most_one_bit_p (int mask)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1270 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1271 /* Perhaps the only thing useful you learn from intensive Microsoft

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1272 technical interviews */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1273 return (mask & (mask - 1)) == 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1274 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1275

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1276 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1277 detect_eol_type (struct detection_state *st, CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1278 unsigned int n)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1279 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1280 int c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1281

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1282 while (n--)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1283 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1284 c = *src++;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1285 if (c == '\r')

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1286 st->eol.just_saw_cr = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1287 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1288 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1289 if (c == '\n')

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1290 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1291 if (st->eol.just_saw_cr)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1292 return EOL_CRLF;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1293 else if (st->eol.seen_anything)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1294 return EOL_LF;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1295 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1296 else if (st->eol.just_saw_cr)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1297 return EOL_CR;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1298 st->eol.just_saw_cr = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1299 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1300 st->eol.seen_anything = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1301 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1302

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1303 return EOL_AUTODETECT;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1304 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1305

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1306 /* Attempt to determine the encoding and EOL type of the given text.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1307 Before calling this function for the first type, you must initialize

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1308 st->eol_type as appropriate and initialize st->mask to ~0.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1309

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1310 st->eol_type holds the determined EOL type, or EOL_AUTODETECT if

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1311 not yet known.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1312

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1313 st->mask holds the determined coding category mask, or ~0 if only

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1314 ASCII has been seen so far.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1315

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1316 Returns:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1317

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1318 0 == st->eol_type is EOL_AUTODETECT and/or more than coding category

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1319 is present in st->mask

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1320 1 == definitive answers are here for both st->eol_type and st->mask

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1321 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1322

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1323 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1324 detect_coding_type (struct detection_state *st, CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1325 unsigned int n, int just_do_eol)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1326 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1327 int c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1328

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1329 if (st->eol_type == EOL_AUTODETECT)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1330 st->eol_type = detect_eol_type (st, src, n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1331

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1332 if (just_do_eol)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1333 return st->eol_type != EOL_AUTODETECT;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1334

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1335 if (!st->seen_non_ascii)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1336 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1337 for (; n; n--, src++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1338 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1339 c = *src;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1340 if ((c < 0x20 && !acceptable_control_char_p (c)) || c >= 0x80)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1341 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1342 st->seen_non_ascii = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1343 st->shift_jis.mask = ~0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1344 st->big5.mask = ~0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1345 st->iso2022.mask = ~0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1346 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1347 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1348 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1349 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1350

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1351 if (!n)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1352 return 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1353

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1354 if (!mask_has_at_most_one_bit_p (st->iso2022.mask))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1355 st->iso2022.mask = detect_coding_iso2022 (st, src, n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1356 if (!mask_has_at_most_one_bit_p (st->shift_jis.mask))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1357 st->shift_jis.mask = detect_coding_shift_jis (st, src, n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1358 if (!mask_has_at_most_one_bit_p (st->big5.mask))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1359 st->big5.mask = detect_coding_big5 (st, src, n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1360

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1361 st->mask = st->iso2022.mask | st->shift_jis.mask | st->big5.mask;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1362

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1363 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1364 int retval = mask_has_at_most_one_bit_p (st->mask);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1365 st->mask |= CODING_CATEGORY_NO_CONVERSION_MASK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1366 return retval && st->eol_type != EOL_AUTODETECT;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1367 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1368 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1369

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1370 static Lisp_Object

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1371 coding_system_from_mask (int mask)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1372 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1373 if (mask == ~0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1374 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1375 /* If the file was entirely or basically ASCII, use the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1376 default value of `file-coding-system'. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1377 Lisp_Object retval =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1378 XBUFFER (Vbuffer_defaults)->file_coding_system;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1379 if (!NILP (retval))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1380 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1381 retval = Ffind_coding_system (retval);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1382 if (NILP (retval))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1383 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1384 warn_when_safe

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1385 (Qbad_variable, Qwarning,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1386 "Invalid `default-file-coding-system', set to nil");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1387 XBUFFER (Vbuffer_defaults)->file_coding_system = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1388 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1389 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1390 if (NILP (retval))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1391 retval = Fget_coding_system (Qno_conversion);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1392 return retval;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1393 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1394 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1395 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1396 int i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1397 int cat = -1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1398

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1399 mask = postprocess_iso2022_mask (mask);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1400

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1401 /* Look through the coding categories by priority and find

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1402 the first one that is allowed. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1403 for (i = 0; i <= CODING_CATEGORY_LAST; i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1404 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1405 cat = coding_category_by_priority[i];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1406 if ((mask & (1 << cat)) &&

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1407 !NILP (coding_category_system[cat]))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1408 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1409 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1410 if (cat >= 0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1411 return coding_category_system[cat];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1412 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1413 return Fget_coding_system (Qno_conversion);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1414 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1415 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1416

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1417 /* Given a seekable read stream and potential coding system and EOL type

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1418 as specified, do any autodetection that is called for. If the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1419 coding system and/or EOL type are not autodetect, they will be left

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1420 alone; but this function will never return an autodetect coding system

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1421 or EOL type.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1422

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1423 This function does not automatically fetch subsidiary coding systems;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1424 that should be unnecessary with the explicit eol-type argument. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1425

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1426 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1427 determine_real_coding_system (Lstream *stream, Lisp_Object *codesys_in_out,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1428 int *eol_type_in_out)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1429 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1430 struct detection_state decst;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1431

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1432 if (*eol_type_in_out == EOL_AUTODETECT)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1433 *eol_type_in_out = XCODING_SYSTEM_EOL_TYPE (*codesys_in_out);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1434

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1435 memset (&decst, 0, sizeof (decst));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1436 decst.eol_type = *eol_type_in_out;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1437 decst.mask = ~0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1438

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1439 /* If autodetection is called for, do it now. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1440 if (XCODING_SYSTEM_TYPE (*codesys_in_out) == CODESYS_AUTODETECT ||

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1441 *eol_type_in_out == EOL_AUTODETECT)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1442 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1443

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1444 while (1)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1445 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1446 unsigned char random_buffer[4096];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1447 int nread;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1448

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1449 nread = Lstream_read (stream, random_buffer, sizeof (random_buffer));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1450 if (!nread)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1451 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1452 if (detect_coding_type (&decst, random_buffer, nread,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1453 XCODING_SYSTEM_TYPE (*codesys_in_out) !=

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1454 CODESYS_AUTODETECT))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1455 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1456 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1457

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1458 *eol_type_in_out = decst.eol_type;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1459 if (XCODING_SYSTEM_TYPE (*codesys_in_out) == CODESYS_AUTODETECT)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1460 *codesys_in_out = coding_system_from_mask (decst.mask);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1461 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1462

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1463 /* If we absolutely can't determine the EOL type, just assume LF. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1464 if (*eol_type_in_out == EOL_AUTODETECT)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1465 *eol_type_in_out = EOL_LF;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1466

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1467 Lstream_rewind (stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1468 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1469

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1470 DEFUN ("detect-coding-region", Fdetect_coding_region, 2, 3, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1471 Detect coding system of the text in the region between START and END.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1472 Returned value is a list of possible coding systems ordered by priority.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1473 If only ASCII characters are found, it returns 'autodetect or one of its

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1474 subsidiary coding systems according to a detected end-of-line type.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1475 Optional arg BUFFER defaults to the current buffer.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1476 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1477 (start, end, buffer))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1478 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1479 Lisp_Object val = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1480 struct buffer *buf = decode_buffer (buffer, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1481 Bufpos b, e;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1482 Lisp_Object instream;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1483 struct detection_state decst;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1484

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1485 get_buffer_range_char (buf, start, end, &b, &e, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1486 instream = make_lisp_buffer_input_stream (buf, b, e, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1487 instream = make_encoding_input_stream (XLSTREAM (instream),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1488 Fget_coding_system (Qbinary));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1489 memset (&decst, 0, sizeof (decst));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1490 decst.eol_type = EOL_AUTODETECT;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1491 decst.mask = ~0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1492 while (1)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1493 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1494 unsigned char random_buffer[4096];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1495 int nread;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1496

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1497 nread = Lstream_read (XLSTREAM (instream), random_buffer,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1498 sizeof (random_buffer));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1499 if (!nread)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1500 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1501 if (detect_coding_type (&decst, random_buffer, nread, 0))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1502 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1503 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1504

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1505 if (decst.mask == ~0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1506 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1507 val = subsidiary_coding_system (Fget_coding_system (Qautodetect),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1508 decst.eol_type);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1509 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1510 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1511 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1512 int i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1513

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1514 val = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1515

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1516 decst.mask = postprocess_iso2022_mask (decst.mask);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1517

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1518 for (i = CODING_CATEGORY_LAST; i >= 0; i--)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1519 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1520 int sys = coding_category_by_priority[i];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1521 if (decst.mask & (1 << sys))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1522 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1523 Lisp_Object codesys = coding_category_system[sys];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1524 if (!NILP (codesys))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1525 codesys = subsidiary_coding_system (codesys, decst.eol_type);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1526 val = Fcons (codesys, val);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1527 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1528 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1529 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1530 return val;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1531 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1532

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1533

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1534 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1535 /* Converting to internal Mule format ("decoding") */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1536 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1537

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1538 /* A decoding stream is a stream used for decoding text (i.e.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1539 converting from some external format to internal format).

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1540 The decoding-stream object keeps track of the actual coding

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1541 stream, the stream that is at the other end, and data that

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1542 needs to be persistent across the lifetime of the stream. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1543

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1544 /* Handle the EOL stuff related to just-read-in character C. EOL is

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1545 the EOL type of the coding stream. FLAGS is the current value of

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1546 FLAGS in the coding stream, and may be modified by this macro.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1547 (The macro only looks at the CODING_STATE_CR flag.) DST is the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1548 Dynarr to which the decoded bytes are to be written. You need to

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1549 also define a local goto label "label_continue_loop" that is at the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1550 end of the main character-reading loop.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1551

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1552 If C is a CR character, then this macro handles it entirely and

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1553 jumps to label_continue_loop. Otherwise, this macro does not add

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1554 anything to DST, and continues normally. You should continue

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1555 processing C normally after this macro. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1556

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1557 #define DECODE_HANDLE_EOL_TYPE(eol, c, flags, dst) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1558 do { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1559 if (c == '\r') \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1560 { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1561 if (eol == EOL_CR) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1562 Dynarr_add (dst, '\n'); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1563 else if (eol != EOL_CRLF || flags & CODING_STATE_CR) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1564 Dynarr_add (dst, c); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1565 else \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1566 flags |= CODING_STATE_CR; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1567 goto label_continue_loop; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1568 } \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1569 else if (flags & CODING_STATE_CR) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1570 { /* eol == CODING_SYSTEM_EOL_CRLF */ \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1571 if (c != '\n') \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1572 Dynarr_add (dst, '\r'); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1573 flags &= ~CODING_STATE_CR; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1574 } \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1575 } while (0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1576

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1577 /* C should be a binary character in the range 0 - 255; convert

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1578 to internal format and add to Dynarr DST. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1579

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1580 #define DECODE_ADD_BINARY_CHAR(c, dst) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1581 do { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1582 if (BYTE_ASCII_P (c)) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1583 Dynarr_add (dst, c); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1584 else if (BYTE_C1_P (c)) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1585 { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1586 Dynarr_add (dst, LEADING_BYTE_CONTROL_1); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1587 Dynarr_add (dst, c + 0x20); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1588 } \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1589 else \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1590 { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1591 Dynarr_add (dst, LEADING_BYTE_LATIN_1); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1592 Dynarr_add (dst, c); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1593 } \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1594 } while (0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1595

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1596 #define DECODE_OUTPUT_PARTIAL_CHAR(ch) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1597 do { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1598 if (ch) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1599 { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1600 DECODE_ADD_BINARY_CHAR (ch, dst); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1601 ch = 0; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1602 } \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1603 } while (0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1604

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1605 #define DECODE_HANDLE_END_OF_CONVERSION(flags, ch, dst)\

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1606 do { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1607 DECODE_OUTPUT_PARTIAL_CHAR (ch); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1608 if (flags & CODING_STATE_END) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1609 { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1610 if (flags & CODING_STATE_CR) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1611 Dynarr_add (dst, '\r'); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1612 } \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1613 } while (0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1614

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1615 #define DECODING_STREAM_DATA(stream) LSTREAM_TYPE_DATA (stream, decoding)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1616

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1617 struct decoding_stream

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1618 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1619 /* Coding system that governs the conversion. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1620 struct Lisp_Coding_System *codesys;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1621

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1622 /* Stream that we read the encoded data from or

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1623 write the decoded data to. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1624 Lstream *other_end;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1625

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1626 /* If we are reading, then we can return only a fixed amount of

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1627 data, so if the conversion resulted in too much data, we store it

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1628 here for retrieval the next time around. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1629 unsigned_char_dynarr *runoff;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1630

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1631 /* FLAGS holds flags indicating the current state of the decoding.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1632 Some of these flags are dependent on the coding system. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1633 unsigned int flags;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1634

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1635 /* CH holds a partially built-up character. Since we only deal

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1636 with one- and two-byte characters at the moment, we only use

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1637 this to store the first byte of a two-byte character. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1638 unsigned int ch;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1639

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1640 /* EOL_TYPE specifies the type of end-of-line conversion that

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1641 currently applies. We need to keep this separate from the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1642 EOL type stored in CODESYS because the latter might indicate

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1643 automatic EOL-type detection while the former will always

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1644 indicate a particular EOL type. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1645 int eol_type;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1646

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1647 /* Additional ISO2022 information. We define the structure above

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1648 because it's also needed by the detection routines. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1649 struct iso2022_decoder iso2022;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1650

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1651 /* Additional information (the state of the running CCL program)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1652 used by the CCL decoder. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1653 struct ccl_program ccl;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1654

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1655 struct detection_state decst;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1656 };

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1657

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1658 static int decoding_reader (Lstream *stream, unsigned char *data, int size);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1659 static int decoding_writer (Lstream *stream, CONST unsigned char *data, int size);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1660 static int decoding_rewinder (Lstream *stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1661 static int decoding_seekable_p (Lstream *stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1662 static int decoding_flusher (Lstream *stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1663 static int decoding_closer (Lstream *stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1664 static Lisp_Object decoding_marker (Lisp_Object stream,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1665 void (*markobj) (Lisp_Object));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1666

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1667 DEFINE_LSTREAM_IMPLEMENTATION ("decoding", lstream_decoding,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1668 sizeof (struct decoding_stream));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1669

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1670 static Lisp_Object

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1671 decoding_marker (Lisp_Object stream, void (*markobj) (Lisp_Object))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1672 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1673 Lstream *str = DECODING_STREAM_DATA (XLSTREAM (stream))->other_end;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1674 Lisp_Object str_obj;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1675

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1676 /* We do not need to mark the coding systems or charsets stored

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1677 within the stream because they are stored in a global list

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1678 and automatically marked. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1679

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1680 XSETLSTREAM (str_obj, str);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1681 (markobj) (str_obj);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1682 if (str->imp->marker)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1683 return (str->imp->marker) (str_obj, markobj);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1684 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1685 return Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1686 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1687

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1688 /* Read SIZE bytes of data and store it into DATA. We are a decoding stream

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1689 so we read data from the other end, decode it, and store it into DATA. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1690

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1691 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1692 decoding_reader (Lstream *stream, unsigned char *data, int size)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1693 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1694 struct decoding_stream *str = DECODING_STREAM_DATA (stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1695 unsigned char *orig_data = data;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1696 int read_size;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1697 int error_occurred = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1698

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1699 /* We need to interface to mule_decode(), which expects to take some

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1700 amount of data and store the result into a Dynarr. We have

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1701 mule_decode() store into str->runoff, and take data from there

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1702 as necessary. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1703

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1704 /* We loop until we have enough data, reading chunks from the other

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1705 end and decoding it. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1706 while (1)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1707 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1708 /* Take data from the runoff if we can. Make sure to take at

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1709 most SIZE bytes, and delete the data from the runoff. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1710 if (Dynarr_length (str->runoff) > 0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1711 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1712 int chunk = min (size, Dynarr_length (str->runoff));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1713 memcpy (data, Dynarr_atp (str->runoff, 0), chunk);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1714 Dynarr_delete_many (str->runoff, 0, chunk);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1715 data += chunk;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1716 size -= chunk;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1717 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1718

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1719 if (size == 0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1720 break; /* No more room for data */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1721

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1722 if (str->flags & CODING_STATE_END)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1723 /* This means that on the previous iteration, we hit the EOF on

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1724 the other end. We loop once more so that mule_decode() can

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1725 output any final stuff it may be holding, or any "go back

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1726 to a sane state" escape sequences. (This latter makes sense

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1727 during encoding.) */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1728 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1729

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1730 /* Exhausted the runoff, so get some more. DATA has at least

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1731 SIZE bytes left of storage in it, so it's OK to read directly

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1732 into it. (We'll be overwriting above, after we've decoded it

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1733 into the runoff.) */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1734 read_size = Lstream_read (str->other_end, data, size);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1735 if (read_size < 0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1736 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1737 error_occurred = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1738 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1739 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1740 if (read_size == 0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1741 /* There might be some more end data produced in the translation.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1742 See the comment above. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1743 str->flags |= CODING_STATE_END;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1744 mule_decode (stream, data, str->runoff, read_size);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1745 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1746

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1747 if (data - orig_data == 0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1748 return error_occurred ? -1 : 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1749 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1750 return data - orig_data;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1751 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1752

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1753 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1754 decoding_writer (Lstream *stream, CONST unsigned char *data, int size)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1755 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1756 struct decoding_stream *str = DECODING_STREAM_DATA (stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1757 int retval;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1758

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1759 /* Decode all our data into the runoff, and then attempt to write

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1760 it all out to the other end. Remove whatever chunk we succeeded

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1761 in writing. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1762 mule_decode (stream, data, str->runoff, size);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1763 retval = Lstream_write (str->other_end, Dynarr_atp (str->runoff, 0),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1764 Dynarr_length (str->runoff));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1765 if (retval > 0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1766 Dynarr_delete_many (str->runoff, 0, retval);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1767 /* Do NOT return retval. The return value indicates how much

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1768 of the incoming data was written, not how many bytes were

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1769 written. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1770 return size;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1771 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1772

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1773 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1774 reset_decoding_stream (struct decoding_stream *str)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1775 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1776 if (CODING_SYSTEM_TYPE (str->codesys) == CODESYS_ISO2022)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1777 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1778 Lisp_Object coding_system = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1779 XSETCODING_SYSTEM (coding_system, str->codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1780 reset_iso2022 (coding_system, &str->iso2022);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1781 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1782 else if (CODING_SYSTEM_TYPE (str->codesys) == CODESYS_CCL)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1783 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1784 set_ccl_program (&str->ccl, CODING_SYSTEM_CCL_DECODE (str->codesys),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1785 0, 0, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1786 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1787

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1788 str->flags = str->ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1789 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1790

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1791 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1792 decoding_rewinder (Lstream *stream)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1793 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1794 struct decoding_stream *str = DECODING_STREAM_DATA (stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1795 reset_decoding_stream (str);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1796 Dynarr_reset (str->runoff);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1797 return Lstream_rewind (str->other_end);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1798 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1799

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1800 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1801 decoding_seekable_p (Lstream *stream)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1802 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1803 struct decoding_stream *str = DECODING_STREAM_DATA (stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1804 return Lstream_seekable_p (str->other_end);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1805 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1806

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1807 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1808 decoding_flusher (Lstream *stream)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1809 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1810 struct decoding_stream *str = DECODING_STREAM_DATA (stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1811 return Lstream_flush (str->other_end);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1812 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1813

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1814 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1815 decoding_closer (Lstream *stream)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1816 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1817 struct decoding_stream *str = DECODING_STREAM_DATA (stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1818 if (stream->flags & LSTREAM_FL_WRITE)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1819 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1820 str->flags |= CODING_STATE_END;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1821 decoding_writer (stream, 0, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1822 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1823 Dynarr_free (str->runoff);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1824 if (str->iso2022.composite_chars)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1825 Dynarr_free (str->iso2022.composite_chars);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1826 return Lstream_close (str->other_end);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1827 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1828

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1829 Lisp_Object

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1830 decoding_stream_coding_system (Lstream *stream)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1831 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1832 Lisp_Object coding_system = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1833 struct decoding_stream *str = DECODING_STREAM_DATA (stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1834

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1835 XSETCODING_SYSTEM (coding_system, str->codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1836 return subsidiary_coding_system (coding_system, str->eol_type);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1837 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1838

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1839 void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1840 set_decoding_stream_coding_system (Lstream *lstr, Lisp_Object codesys)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1841 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1842 struct Lisp_Coding_System *cs = XCODING_SYSTEM (codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1843 struct decoding_stream *str = DECODING_STREAM_DATA (lstr);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1844 str->codesys = cs;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1845 if (CODING_SYSTEM_EOL_TYPE (cs) != EOL_AUTODETECT)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1846 str->eol_type = CODING_SYSTEM_EOL_TYPE (cs);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1847 reset_decoding_stream (str);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1848 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1849

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1850 /* WARNING WARNING WARNING WARNING!!!!! If you open up a decoding

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1851 stream for writing, no automatic code detection will be performed.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1852 The reason for this is that automatic code detection requires a

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1853 seekable input. Things will also fail if you open a decoding

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1854 stream for reading using a non-fully-specified coding system and

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1855 a non-seekable input stream. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1856

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1857 static Lisp_Object

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1858 make_decoding_stream_1 (Lstream *stream, Lisp_Object codesys,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1859 CONST char *mode)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1860 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1861 Lstream *lstr = Lstream_new (lstream_decoding, mode);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1862 struct decoding_stream *str = DECODING_STREAM_DATA (lstr);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1863 Lisp_Object obj;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1864

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1865 memset (str, 0, sizeof (*str));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1866 str->other_end = stream;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1867 str->runoff = (unsigned_char_dynarr *) Dynarr_new (unsigned char);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1868 str->eol_type = EOL_AUTODETECT;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1869 if (!strcmp (mode, "r")

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1870 && Lstream_seekable_p (stream))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1871 /* We can determine the coding system now. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1872 determine_real_coding_system (stream, &codesys, &str->eol_type);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1873 set_decoding_stream_coding_system (lstr, codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1874 str->decst.eol_type = str->eol_type;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1875 str->decst.mask = ~0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1876 XSETLSTREAM (obj, lstr);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1877 return obj;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1878 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1879

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1880 Lisp_Object

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1881 make_decoding_input_stream (Lstream *stream, Lisp_Object codesys)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1882 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1883 return make_decoding_stream_1 (stream, codesys, "r");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1884 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1885

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1886 Lisp_Object

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1887 make_decoding_output_stream (Lstream *stream, Lisp_Object codesys)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1888 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1889 return make_decoding_stream_1 (stream, codesys, "w");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1890 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1891

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1892 /* Note: the decode_coding_? functions all take the same

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1893 arguments as mule_decode(), which is to say some SRC data of

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1894 size N, which is to be stored into dynamic array DST.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1895 DECODING is the stream within which the decoding is

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1896 taking place, but no data is actually read from or

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1897 written to that stream; that is handled in decoding_reader()

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1898 or decoding_writer(). This allows the same functions to

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1899 be used for both reading and writing. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1900

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1901 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1902 mule_decode (Lstream *decoding, CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1903 unsigned_char_dynarr *dst, unsigned int n)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1904 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1905 struct decoding_stream *str = DECODING_STREAM_DATA (decoding);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1906

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1907 /* If necessary, do encoding-detection now. We do this when

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1908 we're a writing stream or a non-seekable reading stream,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1909 meaning that we can't just process the whole input,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1910 rewind, and start over. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1911

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1912 if (CODING_SYSTEM_TYPE (str->codesys) == CODESYS_AUTODETECT ||

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1913 str->eol_type == EOL_AUTODETECT)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1914 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1915 Lisp_Object codesys = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1916

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1917 XSETCODING_SYSTEM (codesys, str->codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1918 detect_coding_type (&str->decst, src, n,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1919 CODING_SYSTEM_TYPE (str->codesys) !=

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1920 CODESYS_AUTODETECT);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1921 if (CODING_SYSTEM_TYPE (str->codesys) == CODESYS_AUTODETECT &&

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1922 str->decst.mask != ~0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1923 /* #### This is cheesy. What we really ought to do is

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1924 buffer up a certain amount of data so as to get a

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1925 less random result. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1926 codesys = coding_system_from_mask (str->decst.mask);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1927 str->eol_type = str->decst.eol_type;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1928 if (XCODING_SYSTEM (codesys) != str->codesys)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1929 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1930 /* Preserve the CODING_STATE_END flag in case it was set.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1931 If we erase it, bad things might happen. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1932 int was_end = str->flags & CODING_STATE_END;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1933 set_decoding_stream_coding_system (decoding, codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1934 if (was_end)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1935 str->flags |= CODING_STATE_END;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1936 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1937 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1938

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1939 switch (CODING_SYSTEM_TYPE (str->codesys))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1940 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1941 #ifdef DEBUG_XEMACS

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1942 case CODESYS_INTERNAL:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1943 Dynarr_add_many (dst, src, n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1944 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1945 #endif

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1946 case CODESYS_AUTODETECT:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1947 /* If we got this far and still haven't decided on the coding

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1948 system, then do no conversion. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1949 case CODESYS_NO_CONVERSION:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1950 decode_coding_no_conversion (decoding, src, dst, n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1951 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1952 case CODESYS_SHIFT_JIS:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1953 decode_coding_shift_jis (decoding, src, dst, n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1954 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1955 case CODESYS_BIG5:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1956 decode_coding_big5 (decoding, src, dst, n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1957 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1958 case CODESYS_CCL:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1959 ccl_driver (&str->ccl, src, dst, n, (str->flags) & CODING_STATE_END);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1960 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1961 case CODESYS_ISO2022:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1962 decode_coding_iso2022 (decoding, src, dst, n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1963 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1964 default:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1965 abort ();

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1966 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1967 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1968

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1969 static Lisp_Object

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1970 close_both_streams (Lisp_Object cons)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1971 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1972 Lisp_Object instream = XCAR (cons);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1973 Lisp_Object outstream = XCDR (cons);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1974 Lstream_close (XLSTREAM (outstream));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1975 Lstream_close (XLSTREAM (instream));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1976 return Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1977 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1978

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1979 DEFUN ("decode-coding-region", Fdecode_coding_region, 3, 4, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1980 Decode the text between START and END which is encoded in CODING-SYSTEM.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1981 This is useful if you've read in encoded text from a file without decoding

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1982 it (e.g. you read in a JIS-formatted file but used the `binary' or

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1983 `no-conversion' coding system, so that it shows up as \"^[$B!<!+^[(B\").

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1984 Return length of decoded text.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1985 BUFFER defaults to the current buffer if unspecified.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1986 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1987 (start, end, coding_system, buffer))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1988 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1989 Bufpos b, e;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1990 struct buffer *buf = decode_buffer (buffer, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1991 Lisp_Object instream, outstream;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1992 int speccount = specpdl_depth ();

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1993 struct gcpro gcpro1, gcpro2;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1994

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1995 get_buffer_range_char (buf, start, end, &b, &e, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1996 coding_system = Fget_coding_system (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1997 instream = make_lisp_buffer_input_stream (buf, b, e, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1998 outstream = make_lisp_buffer_output_stream (buf, b, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

1999 outstream = make_decoding_output_stream (XLSTREAM (outstream),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2000 coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2001 outstream = make_encoding_output_stream (XLSTREAM (outstream),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2002 Fget_coding_system (Qbinary));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2003 GCPRO2 (instream, outstream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2004 record_unwind_protect (close_both_streams, Fcons (instream, outstream));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2005

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2006 /* The chain of streams looks like this:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2007

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2008 [BUFFER] <----- send through

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2009 ------> [ENCODE AS BINARY]

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2010 ------> [DECODE AS SPECIFIED]

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2011 ------> [BUFFER]

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2012 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2013

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2014 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2015 char tempbuf[1024]; /* some random amount */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2016 Lstream *in = XLSTREAM(instream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2017 Lstream *out = XLSTREAM(outstream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2018 Bufpos newpos, even_newer_pos;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2019

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2020 while (1)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2021 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2022 Bufpos oldpos = lisp_buffer_stream_startpos (in);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2023 int size_in_bytes = Lstream_read (in, tempbuf, sizeof (tempbuf));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2024 if (!size_in_bytes)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2025 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2026 newpos = lisp_buffer_stream_startpos (in);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2027 Lstream_write (out, tempbuf, size_in_bytes);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2028 even_newer_pos = lisp_buffer_stream_startpos (in);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2029 buffer_delete_range (buf, even_newer_pos - (newpos - oldpos),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2030 even_newer_pos, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2031 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2032 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2033

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2034 unbind_to (speccount, Qnil);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2035 UNGCPRO;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2036 return Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2037 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2038

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2039

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2040 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2041 /* Converting to an external encoding ("encoding") */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2042 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2043

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2044 /* An encoding stream is an output stream. When you create the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2045 stream, you specify the coding system that governs the encoding

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2046 and another stream that the resulting encoded data is to be

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2047 sent to, and then start sending data to it. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2048

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2049 #define ENCODING_STREAM_DATA(stream) LSTREAM_TYPE_DATA (stream, encoding)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2050

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2051 struct encoding_stream

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2052 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2053 /* Coding system that governs the conversion. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2054 struct Lisp_Coding_System *codesys;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2055

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2056 /* Stream that we read the encoded data from or

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2057 write the decoded data to. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2058 Lstream *other_end;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2059

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2060 /* If we are reading, then we can return only a fixed amount of

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2061 data, so if the conversion resulted in too much data, we store it

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2062 here for retrieval the next time around. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2063 unsigned_char_dynarr *runoff;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2064

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2065 /* FLAGS holds flags indicating the current state of the encoding.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2066 Some of these flags are dependent on the coding system. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2067 unsigned int flags;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2068

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2069 /* CH holds a partially built-up character. Since we only deal

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2070 with one- and two-byte characters at the moment, we only use

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2071 this to store the first byte of a two-byte character. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2072 unsigned int ch;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2073

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2074 /* Additional information used by the ISO2022 encoder. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2075 struct

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2076 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2077 /* CHARSET holds the character sets currently assigned to the G0

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2078 through G3 registers. It is initialized from the array

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2079 INITIAL_CHARSET in CODESYS. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2080 Lisp_Object charset[4];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2081

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2082 /* Which registers are currently invoked into the left (GL) and

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2083 right (GR) halves of the 8-bit encoding space? */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2084 int register_left, register_right;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2085

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2086 /* Whether we need to explicitly designate the charset in the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2087 G? register before using it. It is initialized from the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2088 array FORCE_CHARSET_ON_OUTPUT in CODESYS. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2089 unsigned char force_charset_on_output[4];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2090

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2091 /* Other state variables that need to be preserved across

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2092 invocations. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2093 Lisp_Object current_charset;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2094 int current_half;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2095 int current_char_boundary;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2096 } iso2022;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2097

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2098 /* Additional information (the state of the running CCL program)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2099 used by the CCL encoder. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2100 struct ccl_program ccl;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2101 };

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2102

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2103 static int encoding_reader (Lstream *stream, unsigned char *data, int size);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2104 static int encoding_writer (Lstream *stream, CONST unsigned char *data,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2105 int size);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2106 static int encoding_rewinder (Lstream *stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2107 static int encoding_seekable_p (Lstream *stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2108 static int encoding_flusher (Lstream *stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2109 static int encoding_closer (Lstream *stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2110 static Lisp_Object encoding_marker (Lisp_Object stream,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2111 void (*markobj) (Lisp_Object));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2112

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2113 DEFINE_LSTREAM_IMPLEMENTATION ("encoding", lstream_encoding,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2114 sizeof (struct encoding_stream));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2115

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2116 static Lisp_Object

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2117 encoding_marker (Lisp_Object stream, void (*markobj) (Lisp_Object))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2118 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2119 Lstream *str = ENCODING_STREAM_DATA (XLSTREAM (stream))->other_end;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2120 Lisp_Object str_obj;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2121

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2122 /* We do not need to mark the coding systems or charsets stored

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2123 within the stream because they are stored in a global list

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2124 and automatically marked. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2125

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2126 XSETLSTREAM (str_obj, str);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2127 (markobj) (str_obj);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2128 if (str->imp->marker)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2129 return (str->imp->marker) (str_obj, markobj);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2130 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2131 return Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2132 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2133

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2134 /* Read SIZE bytes of data and store it into DATA. We are a encoding stream

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2135 so we read data from the other end, encode it, and store it into DATA. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2136

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2137 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2138 encoding_reader (Lstream *stream, unsigned char *data, int size)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2139 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2140 struct encoding_stream *str = ENCODING_STREAM_DATA (stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2141 unsigned char *orig_data = data;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2142 int read_size;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2143 int error_occurred = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2144

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2145 /* We need to interface to mule_encode(), which expects to take some

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2146 amount of data and store the result into a Dynarr. We have

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2147 mule_encode() store into str->runoff, and take data from there

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2148 as necessary. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2149

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2150 /* We loop until we have enough data, reading chunks from the other

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2151 end and encoding it. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2152 while (1)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2153 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2154 /* Take data from the runoff if we can. Make sure to take at

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2155 most SIZE bytes, and delete the data from the runoff. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2156 if (Dynarr_length (str->runoff) > 0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2157 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2158 int chunk = min (size, Dynarr_length (str->runoff));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2159 memcpy (data, Dynarr_atp (str->runoff, 0), chunk);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2160 Dynarr_delete_many (str->runoff, 0, chunk);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2161 data += chunk;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2162 size -= chunk;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2163 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2164

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2165 if (size == 0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2166 break; /* No more room for data */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2167

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2168 if (str->flags & CODING_STATE_END)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2169 /* This means that on the previous iteration, we hit the EOF on

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2170 the other end. We loop once more so that mule_encode() can

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2171 output any final stuff it may be holding, or any "go back

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2172 to a sane state" escape sequences. (This latter makes sense

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2173 during encoding.) */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2174 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2175

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2176 /* Exhausted the runoff, so get some more. DATA at least SIZE bytes

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2177 left of storage in it, so it's OK to read directly into it.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2178 (We'll be overwriting above, after we've encoded it into the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2179 runoff.) */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2180 read_size = Lstream_read (str->other_end, data, size);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2181 if (read_size < 0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2182 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2183 error_occurred = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2184 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2185 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2186 if (read_size == 0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2187 /* There might be some more end data produced in the translation.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2188 See the comment above. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2189 str->flags |= CODING_STATE_END;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2190 mule_encode (stream, data, str->runoff, read_size);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2191 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2192

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2193 if (data - orig_data == 0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2194 return error_occurred ? -1 : 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2195 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2196 return data - orig_data;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2197 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2198

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2199 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2200 encoding_writer (Lstream *stream, CONST unsigned char *data, int size)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2201 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2202 struct encoding_stream *str = ENCODING_STREAM_DATA (stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2203 int retval;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2204

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2205 /* Encode all our data into the runoff, and then attempt to write

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2206 it all out to the other end. Remove whatever chunk we succeeded

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2207 in writing. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2208 mule_encode (stream, data, str->runoff, size);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2209 retval = Lstream_write (str->other_end, Dynarr_atp (str->runoff, 0),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2210 Dynarr_length (str->runoff));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2211 if (retval > 0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2212 Dynarr_delete_many (str->runoff, 0, retval);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2213 /* Do NOT return retval. The return value indicates how much

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2214 of the incoming data was written, not how many bytes were

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2215 written. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2216 return size;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2217 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2218

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2219 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2220 reset_encoding_stream (struct encoding_stream *str)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2221 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2222 if (CODING_SYSTEM_TYPE (str->codesys) == CODESYS_ISO2022)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2223 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2224 int i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2225

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2226 for (i = 0; i < 4; i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2227 str->iso2022.charset[i] =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2228 CODING_SYSTEM_ISO2022_INITIAL_CHARSET (str->codesys, i);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2229 for (i = 0; i < 4; i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2230 str->iso2022.force_charset_on_output[i] =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2231 CODING_SYSTEM_ISO2022_FORCE_CHARSET_ON_OUTPUT (str->codesys, i);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2232 str->iso2022.register_left = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2233 str->iso2022.register_right = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2234 str->iso2022.current_charset = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2235 str->iso2022.current_half = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2236 str->iso2022.current_char_boundary = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2237 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2238 else if (CODING_SYSTEM_TYPE (str->codesys) == CODESYS_CCL)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2239 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2240 set_ccl_program (&str->ccl, CODING_SYSTEM_CCL_ENCODE (str->codesys), 0, 0, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2241 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2242 str->flags = str->ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2243 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2244

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2245 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2246 encoding_rewinder (Lstream *stream)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2247 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2248 struct encoding_stream *str = ENCODING_STREAM_DATA (stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2249 reset_encoding_stream (str);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2250 Dynarr_reset (str->runoff);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2251 return Lstream_rewind (str->other_end);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2252 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2253

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2254 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2255 encoding_seekable_p (Lstream *stream)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2256 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2257 struct encoding_stream *str = ENCODING_STREAM_DATA (stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2258 return Lstream_seekable_p (str->other_end);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2259 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2260

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2261 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2262 encoding_flusher (Lstream *stream)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2263 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2264 struct encoding_stream *str = ENCODING_STREAM_DATA (stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2265 return Lstream_flush (str->other_end);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2266 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2267

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2268 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2269 encoding_closer (Lstream *stream)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2270 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2271 struct encoding_stream *str = ENCODING_STREAM_DATA (stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2272 if (stream->flags & LSTREAM_FL_WRITE)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2273 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2274 str->flags |= CODING_STATE_END;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2275 encoding_writer (stream, 0, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2276 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2277 Dynarr_free (str->runoff);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2278 return Lstream_close (str->other_end);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2279 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2280

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2281 Lisp_Object

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2282 encoding_stream_coding_system (Lstream *stream)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2283 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2284 Lisp_Object coding_system = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2285 struct encoding_stream *str = ENCODING_STREAM_DATA (stream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2286

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2287 XSETCODING_SYSTEM (coding_system, str->codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2288 return coding_system;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2289 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2290

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2291 void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2292 set_encoding_stream_coding_system (Lstream *lstr, Lisp_Object codesys)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2293 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2294 struct Lisp_Coding_System *cs = XCODING_SYSTEM (codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2295 struct encoding_stream *str = ENCODING_STREAM_DATA (lstr);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2296 str->codesys = cs;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2297 reset_encoding_stream (str);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2298 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2299

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2300 static Lisp_Object

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2301 make_encoding_stream_1 (Lstream *stream, Lisp_Object codesys,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2302 CONST char *mode)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2303 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2304 Lstream *lstr = Lstream_new (lstream_encoding, mode);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2305 struct encoding_stream *str = ENCODING_STREAM_DATA (lstr);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2306 Lisp_Object obj;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2307

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2308 memset (str, 0, sizeof (*str));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2309 str->runoff = (unsigned_char_dynarr *) Dynarr_new (unsigned char);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2310 str->other_end = stream;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2311 set_encoding_stream_coding_system (lstr, codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2312 XSETLSTREAM (obj, lstr);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2313 return obj;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2314 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2315

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2316 Lisp_Object

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2317 make_encoding_input_stream (Lstream *stream, Lisp_Object codesys)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2318 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2319 return make_encoding_stream_1 (stream, codesys, "r");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2320 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2321

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2322 Lisp_Object

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2323 make_encoding_output_stream (Lstream *stream, Lisp_Object codesys)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2324 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2325 return make_encoding_stream_1 (stream, codesys, "w");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2326 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2327

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2328 /* Convert N bytes of internally-formatted data stored in SRC to an

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2329 external format, according to the encoding stream ENCODING.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2330 Store the encoded data into DST. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2331

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2332 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2333 mule_encode (Lstream *encoding, CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2334 unsigned_char_dynarr *dst, unsigned int n)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2335 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2336 struct encoding_stream *str = ENCODING_STREAM_DATA (encoding);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2337

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2338 switch (CODING_SYSTEM_TYPE (str->codesys))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2339 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2340 #ifdef DEBUG_XEMACS

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2341 case CODESYS_INTERNAL:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2342 Dynarr_add_many (dst, src, n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2343 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2344 #endif

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2345 case CODESYS_AUTODETECT:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2346 /* If we got this far and still haven't decided on the coding

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2347 system, then do no conversion. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2348 case CODESYS_NO_CONVERSION:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2349 encode_coding_no_conversion (encoding, src, dst, n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2350 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2351 case CODESYS_SHIFT_JIS:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2352 encode_coding_shift_jis (encoding, src, dst, n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2353 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2354 case CODESYS_BIG5:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2355 encode_coding_big5 (encoding, src, dst, n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2356 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2357 case CODESYS_CCL:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2358 ccl_driver (&str->ccl, src, dst, n, (str->flags) & CODING_STATE_END);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2359 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2360 case CODESYS_ISO2022:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2361 encode_coding_iso2022 (encoding, src, dst, n);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2362 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2363 default:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2364 abort ();

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2365 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2366 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2367

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2368 DEFUN ("encode-coding-region", Fencode_coding_region, 3, 4, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2369 Encode the text between START and END using CODING-SYSTEM.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2370 This will, for example, convert Japanese characters into stuff such as

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2371 \"^[$B!<!+^[(B\" if you use the JIS encoding. Return length of encoded

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2372 text. BUFFER defaults to the current buffer if unspecified.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2373 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2374 (start, end, coding_system, buffer))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2375 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2376 Bufpos b, e;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2377 struct buffer *buf = decode_buffer (buffer, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2378 Lisp_Object instream, outstream;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2379 char tempbuf[1024]; /* some random amount */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2380 int speccount = specpdl_depth ();

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2381 struct gcpro gcpro1, gcpro2;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2382

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2383 get_buffer_range_char (buf, start, end, &b, &e, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2384 coding_system = Fget_coding_system (coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2385 instream = make_lisp_buffer_input_stream (buf, b, e, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2386 outstream = make_lisp_buffer_output_stream (buf, b, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2387 outstream = make_decoding_output_stream (XLSTREAM (outstream),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2388 Fget_coding_system (Qbinary));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2389 outstream = make_encoding_output_stream (XLSTREAM (outstream),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2390 coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2391 GCPRO2 (instream, outstream);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2392 record_unwind_protect (close_both_streams, Fcons (instream, outstream));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2393 /* The chain of streams looks like this:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2394

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2395 [BUFFER] <----- send through

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2396 ------> [ENCODE AS SPECIFIED]

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2397 ------> [DECODE AS BINARY]

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2398 ------> [BUFFER]

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2399

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2400 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2401 while (1)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2402 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2403 int size_in_bytes;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2404 Bufpos oldpos, newpos, even_newer_pos;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2405

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2406 oldpos = lisp_buffer_stream_startpos (XLSTREAM (instream));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2407 size_in_bytes = Lstream_read (XLSTREAM (instream), tempbuf,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2408 sizeof (tempbuf));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2409 if (!size_in_bytes)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2410 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2411 newpos = lisp_buffer_stream_startpos (XLSTREAM (instream));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2412 Lstream_write (XLSTREAM (outstream), tempbuf, size_in_bytes);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2413 even_newer_pos = lisp_buffer_stream_startpos (XLSTREAM (instream));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2414 buffer_delete_range (buf, even_newer_pos - (newpos - oldpos),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2415 even_newer_pos, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2416 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2417

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2418 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2419 Charcount retlen =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2420 lisp_buffer_stream_startpos (XLSTREAM (instream)) - b;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2421 unbind_to (speccount, Qnil);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2422 UNGCPRO;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2423 return make_int (retlen);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2424 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2425 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2426

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2427

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2428 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2429 /* Shift-JIS methods */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2430 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2431

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2432 /* Shift-JIS is a coding system encoding three character sets: ASCII, right

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2433 half of JISX0201-Kana, and JISX0208. An ASCII character is encoded

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2434 as is. A character of JISX0201-Kana (TYPE94 character set) is

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2435 encoded by "position-code + 0x80". A character of JISX0208

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2436 (TYPE94x94 character set) is encoded in 2-byte but two

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2437 position-codes are divided and shifted so that it fit in the range

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2438 below.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2439

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2440 --- CODE RANGE of Shift-JIS ---

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2441 (character set) (range)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2442 ASCII 0x00 .. 0x7F

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2443 JISX0201-Kana 0xA0 .. 0xDF

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2444 JISX0208 (1st byte) 0x80 .. 0x9F and 0xE0 .. 0xEF

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2445 (2nd byte) 0x40 .. 0x7E and 0x80 .. 0xFC

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2446 -------------------------------

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2447

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2448 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2449

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2450 /* Is this the first byte of a Shift-JIS two-byte char? */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2451

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2452 #define BYTE_SHIFT_JIS_TWO_BYTE_1_P(c) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2453 (((c) >= 0x81 && (c) <= 0x9F) || ((c) >= 0xE0 && (c) <= 0xEF))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2454

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2455 /* Is this the second byte of a Shift-JIS two-byte char? */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2456

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2457 #define BYTE_SHIFT_JIS_TWO_BYTE_2_P(c) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2458 (((c) >= 0x40 && (c) <= 0x7E) || ((c) >= 0x80 && (c) <= 0xFC))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2459

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2460 #define BYTE_SHIFT_JIS_KATAKANA_P(c) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2461 ((c) >= 0xA1 && (c) <= 0xDF)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2462

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2463 /* Code conversion macros. These are macros because they are used in

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2464 inner loops during code conversion.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2465

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2466 Note that temporary variables in macros introduce the classic

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2467 dynamic-scoping problems with variable names. We use capital-

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2468 lettered variables in the assumption that XEmacs does not use

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2469 capital letters in variables except in a very formalized way

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2470 (e.g. Qstring). */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2471

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2472 /* Convert shift-JIS code (sj1, sj2) into internal string

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2473 representation (c1, c2). (The leading byte is assumed.) */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2474

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2475 #define DECODE_SHIFT_JIS(sj1, sj2, c1, c2) do \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2476 { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2477 int I1 = sj1, I2 = sj2; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2478 if (I2 >= 0x9f) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2479 { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2480 if (I1 >= 0xe0) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2481 c1 = (I1 << 1) - 0xe0; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2482 else \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2483 c1 = (I1 << 1) - 0x60; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2484 c2 = I2 + 2; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2485 } \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2486 else \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2487 { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2488 if (I1 >= 0xe0) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2489 c1 = (I1 << 1) - 0xe1; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2490 else \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2491 c1 = (I1 << 1) - 0x61; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2492 if (I2 >= 0x7f) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2493 c2 = I2 + 0x60; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2494 else \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2495 c2 = I2 + 0x61; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2496 } \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2497 } while (0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2498

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2499 /* Convert the internal string representation of a Shift-JIS character

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2500 (c1, c2) into Shift-JIS code (sj1, sj2). The leading byte is

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2501 assumed. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2502

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2503 #define ENCODE_SHIFT_JIS(c1, c2, sj1, sj2) do \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2504 { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2505 int I1 = c1, I2 = sj2; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2506 if (I1 & 1) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2507 { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2508 if (I1 < 0xdf) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2509 sj1 = (I1 >> 1) + 0x31; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2510 else \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2511 sj1 = (I1 >> 1) + 0x71; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2512 if (I2 >= 0xe0) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2513 sj2 = I2 - 0x60; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2514 else \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2515 sj2 = I2 - 0x61; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2516 } \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2517 else \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2518 { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2519 if (I1 < 0xdf) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2520 sj1 = (I1 >> 1) + 0x30; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2521 else \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2522 sj1 = (I1 >> 1) + 0x70; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2523 sj2 = I2 - 2; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2524 } \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2525 } while (0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2526

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2527 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2528 detect_coding_shift_jis (struct detection_state *st, CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2529 unsigned int n)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2530 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2531 int c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2532

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2533 while (n--)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2534 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2535 c = *src++;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2536 if (c == ISO_CODE_ESC || c == ISO_CODE_SI || c == ISO_CODE_SO)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2537 return 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2538 if (st->shift_jis.in_second_byte)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2539 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2540 st->shift_jis.in_second_byte = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2541 if (c < 0x40)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2542 return 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2543 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2544 else if ((c >= 0x80 && c < 0xA0) || c >= 0xE0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2545 st->shift_jis.in_second_byte = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2546 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2547 return CODING_CATEGORY_SHIFT_JIS_MASK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2548 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2549

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2550 /* Convert Shift-JIS data to internal format. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2551

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2552 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2553 decode_coding_shift_jis (Lstream *decoding, CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2554 unsigned_char_dynarr *dst, unsigned int n)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2555 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2556 unsigned char c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2557 unsigned int flags, ch;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2558 int eol;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2559 struct decoding_stream *str = DECODING_STREAM_DATA (decoding);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2560

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2561 CODING_STREAM_DECOMPOSE (str, flags, ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2562 eol = str->eol_type;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2563

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2564 while (n--)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2565 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2566 c = *src++;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2567

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2568 if (ch)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2569 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2570 /* Previous character was first byte of Shift-JIS Kanji char. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2571 if (BYTE_SHIFT_JIS_TWO_BYTE_2_P (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2572 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2573 unsigned char e1, e2;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2574

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2575 Dynarr_add (dst, LEADING_BYTE_JAPANESE_JISX0208);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2576 DECODE_SHIFT_JIS (ch, c, e1, e2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2577 Dynarr_add (dst, e1);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2578 Dynarr_add (dst, e2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2579 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2580 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2581 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2582 DECODE_ADD_BINARY_CHAR (ch, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2583 DECODE_ADD_BINARY_CHAR (c, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2584 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2585 ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2586 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2587 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2588 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2589 DECODE_HANDLE_EOL_TYPE (eol, c, flags, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2590 if (BYTE_SHIFT_JIS_TWO_BYTE_1_P (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2591 ch = c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2592 else if (BYTE_SHIFT_JIS_KATAKANA_P (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2593 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2594 Dynarr_add (dst, LEADING_BYTE_JAPANESE_JISX0201_KANA);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2595 Dynarr_add (dst, c);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2596 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2597 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2598 DECODE_ADD_BINARY_CHAR (c, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2599 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2600 label_continue_loop:;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2601 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2602

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2603 DECODE_HANDLE_END_OF_CONVERSION (flags, ch, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2604

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2605 CODING_STREAM_COMPOSE (str, flags, ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2606 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2607

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2608 /* Convert internally-formatted data to Shift-JIS. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2609

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2610 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2611 encode_coding_shift_jis (Lstream *encoding, CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2612 unsigned_char_dynarr *dst, unsigned int n)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2613 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2614 unsigned char c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2615 struct encoding_stream *str = ENCODING_STREAM_DATA (encoding);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2616 unsigned int flags, ch;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2617 int eol;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2618

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2619 CODING_STREAM_DECOMPOSE (str, flags, ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2620 eol = CODING_SYSTEM_EOL_TYPE (str->codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2621

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2622 while (n--)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2623 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2624 c = *src++;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2625 if (c == '\n')

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2626 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2627 if (eol != EOL_LF && eol != EOL_AUTODETECT)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2628 Dynarr_add (dst, '\r');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2629 if (eol != EOL_CR)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2630 Dynarr_add (dst, '\n');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2631 ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2632 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2633 else if (BYTE_ASCII_P (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2634 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2635 Dynarr_add (dst, c);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2636 ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2637 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2638 else if (BUFBYTE_LEADING_BYTE_P (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2639 ch = (c == LEADING_BYTE_JAPANESE_JISX0201_KANA ||

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2640 c == LEADING_BYTE_JAPANESE_JISX0208_1978 ||

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2641 c == LEADING_BYTE_JAPANESE_JISX0208) ? c : 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2642 else if (ch)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2643 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2644 if (ch == LEADING_BYTE_JAPANESE_JISX0201_KANA)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2645 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2646 Dynarr_add (dst, c);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2647 ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2648 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2649 else if (ch == LEADING_BYTE_JAPANESE_JISX0208_1978 ||

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2650 ch == LEADING_BYTE_JAPANESE_JISX0208)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2651 ch = c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2652 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2653 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2654 unsigned char j1, j2;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2655 ENCODE_SHIFT_JIS (ch, c, j1, j2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2656 Dynarr_add (dst, j1);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2657 Dynarr_add (dst, j2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2658 ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2659 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2660 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2661 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2662

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2663 CODING_STREAM_COMPOSE (str, flags, ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2664 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2665

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2666 DEFUN ("decode-shift-jis-char", Fdecode_shift_jis_char, 1, 1, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2667 Decode a JISX0208 character of Shift-JIS coding-system.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2668 CODE is the character code in Shift-JIS as a cons of type bytes.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2669 Return the corresponding character.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2670 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2671 (code))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2672 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2673 unsigned char c1, c2, s1, s2;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2674

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2675 CHECK_CONS (code);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2676 CHECK_INT (XCAR (code));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2677 CHECK_INT (XCDR (code));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2678 s1 = XINT (XCAR (code));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2679 s2 = XINT (XCDR (code));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2680 if (BYTE_SHIFT_JIS_TWO_BYTE_1_P (s1) &&

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2681 BYTE_SHIFT_JIS_TWO_BYTE_2_P (s2))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2682 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2683 DECODE_SHIFT_JIS (s1, s2, c1, c2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2684 return make_char (MAKE_CHAR (Vcharset_japanese_jisx0208,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2685 c1 & 0x7F, c2 & 0x7F));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2686 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2687 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2688 return Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2689 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2690

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2691 DEFUN ("encode-shift-jis-char", Fencode_shift_jis_char, 1, 1, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2692 Encode a JISX0208 character CHAR to SHIFT-JIS coding-system.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2693 Return the corresponding character code in SHIFT-JIS as a cons of two bytes.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2694 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2695 (ch))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2696 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2697 Lisp_Object charset;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2698 int c1, c2, s1, s2;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2699

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2700 CHECK_CHAR_COERCE_INT (ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2701 BREAKUP_CHAR (XCHAR (ch), charset, c1, c2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2702 if (EQ (charset, Vcharset_japanese_jisx0208))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2703 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2704 ENCODE_SHIFT_JIS (c1 | 0x80, c2 | 0x80, s1, s2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2705 return Fcons (make_int (s1), make_int (s2));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2706 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2707 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2708 return Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2709 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2710

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2711

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2712 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2713 /* Big5 methods */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2714 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2715

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2716 /* BIG5 is a coding system encoding two character sets: ASCII and

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2717 Big5. An ASCII character is encoded as is. Big5 is a two-byte

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2718 character set and is encoded in two-byte.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2719

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2720 --- CODE RANGE of BIG5 ---

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2721 (character set) (range)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2722 ASCII 0x00 .. 0x7F

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2723 Big5 (1st byte) 0xA1 .. 0xFE

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2724 (2nd byte) 0x40 .. 0x7E and 0xA1 .. 0xFE

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2725 --------------------------

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2726

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2727 Since the number of characters in Big5 is larger than maximum

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2728 characters in Emacs' charset (96x96), it can't be handled as one

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2729 charset. So, in Emacs, Big5 is devided into two: `charset-big5-1'

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2730 and `charset-big5-2'. Both <type>s are TYPE94x94. The former

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2731 contains frequently used characters and the latter contains less

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2732 frequently used characters. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2733

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2734 #define BYTE_BIG5_TWO_BYTE_1_P(c) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2735 ((c) >= 0xA1 && (c) <= 0xFE)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2736

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2737 /* Is this the second byte of a Shift-JIS two-byte char? */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2738

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2739 #define BYTE_BIG5_TWO_BYTE_2_P(c) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2740 (((c) >= 0x40 && (c) <= 0x7E) || ((c) >= 0xA1 && (c) <= 0xFE))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2741

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2742 /* Number of Big5 characters which have the same code in 1st byte. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2743

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2744 #define BIG5_SAME_ROW (0xFF - 0xA1 + 0x7F - 0x40)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2745

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2746 /* Code conversion macros. These are macros because they are used in

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2747 inner loops during code conversion.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2748

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2749 Note that temporary variables in macros introduce the classic

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2750 dynamic-scoping problems with variable names. We use capital-

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2751 lettered variables in the assumption that XEmacs does not use

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2752 capital letters in variables except in a very formalized way

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2753 (e.g. Qstring). */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2754

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2755 /* Convert Big5 code (b1, b2) into its internal string representation

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2756 (lb, c1, c2). */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2757

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2758 /* There is a much simpler way to split the Big5 charset into two.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2759 For the moment I'm going to leave the algorithm as-is because it

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2760 claims to separate out the most-used characters into a single

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2761 charset, which perhaps will lead to optimizations in various

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2762 places.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2763

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2764 The way the algorithm works is something like this:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2765

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2766 Big5 can be viewed as a 94x157 charset, where the row is

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2767 encoded into the bytes 0xA1 .. 0xFE and the column is encoded

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2768 into the bytes 0x40 .. 0x7E and 0xA1 .. 0xFE. As for frequency,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2769 the split between low and high column numbers is apparently

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2770 meaningless; ascending rows produce less and less frequent chars.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2771 Therefore, we assign the lower half of rows (0xA1 .. 0xC8) to

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2772 the first charset, and the upper half (0xC9 .. 0xFE) to the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2773 second. To do the conversion, we convert the character into

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2774 a single number where 0 .. 156 is the first row, 157 .. 313

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2775 is the second, etc. That way, the characters are ordered by

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2776 decreasing frequency. Then we just chop the space in two

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2777 and coerce the result into a 94x94 space.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2778 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2779

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2780 #define DECODE_BIG5(b1, b2, lb, c1, c2) do \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2781 { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2782 int B1 = b1, B2 = b2; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2783 unsigned int I \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2784 = (B1 - 0xA1) * BIG5_SAME_ROW + B2 - (B2 < 0x7F ? 0x40 : 0x62); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2785 \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2786 if (B1 < 0xC9) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2787 { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2788 lb = LEADING_BYTE_CHINESE_BIG5_1; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2789 } \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2790 else \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2791 { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2792 lb = LEADING_BYTE_CHINESE_BIG5_2; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2793 I -= (BIG5_SAME_ROW) * (0xC9 - 0xA1); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2794 } \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2795 c1 = I / (0xFF - 0xA1) + 0xA1; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2796 c2 = I % (0xFF - 0xA1) + 0xA1; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2797 } while (0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2798

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2799 /* Convert the internal string representation of a Big5 character

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2800 (lb, c1, c2) into Big5 code (b1, b2). */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2801

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2802 #define ENCODE_BIG5(lb, c1, c2, b1, b2) do \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2803 { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2804 unsigned int I = ((c1) - 0xA1) * (0xFF - 0xA1) + ((c2) - 0xA1); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2805 \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2806 if (lb == LEADING_BYTE_CHINESE_BIG5_2) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2807 { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2808 I += BIG5_SAME_ROW * (0xC9 - 0xA1); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2809 } \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2810 b1 = I / BIG5_SAME_ROW + 0xA1; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2811 b2 = I % BIG5_SAME_ROW; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2812 b2 += b2 < 0x3F ? 0x40 : 0x62; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2813 } while (0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2814

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2815 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2816 detect_coding_big5 (struct detection_state *st, CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2817 unsigned int n)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2818 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2819 int c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2820

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2821 while (n--)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2822 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2823 c = *src++;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2824 if (c == ISO_CODE_ESC || c == ISO_CODE_SI || c == ISO_CODE_SO ||

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2825 (c >= 0x80 && c <= 0xA0))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2826 return 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2827 if (st->big5.in_second_byte)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2828 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2829 st->big5.in_second_byte = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2830 if (c < 0x40 || (c >= 0x80 && c <= 0xA0))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2831 return 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2832 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2833 else if (c >= 0xA1)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2834 st->big5.in_second_byte = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2835 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2836 return CODING_CATEGORY_BIG5_MASK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2837 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2838

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2839 /* Convert Big5 data to internal format. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2840

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2841 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2842 decode_coding_big5 (Lstream *decoding, CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2843 unsigned_char_dynarr *dst, unsigned int n)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2844 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2845 unsigned char c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2846 unsigned int flags, ch, eol;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2847 struct decoding_stream *str = DECODING_STREAM_DATA (decoding);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2848

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2849 CODING_STREAM_DECOMPOSE (str, flags, ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2850 eol = str->eol_type;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2851

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2852 while (n--)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2853 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2854 c = *src++;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2855 if (ch)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2856 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2857 /* Previous character was first byte of Big5 char. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2858 if (BYTE_BIG5_TWO_BYTE_2_P (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2859 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2860 unsigned char b1, b2, b3;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2861 DECODE_BIG5 (ch, c, b1, b2, b3);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2862 Dynarr_add (dst, b1);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2863 Dynarr_add (dst, b2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2864 Dynarr_add (dst, b3);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2865 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2866 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2867 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2868 DECODE_ADD_BINARY_CHAR (ch, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2869 DECODE_ADD_BINARY_CHAR (c, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2870 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2871 ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2872 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2873 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2874 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2875 DECODE_HANDLE_EOL_TYPE (eol, c, flags, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2876 if (BYTE_BIG5_TWO_BYTE_1_P (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2877 ch = c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2878 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2879 DECODE_ADD_BINARY_CHAR (c, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2880 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2881 label_continue_loop:;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2882 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2883

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2884 DECODE_HANDLE_END_OF_CONVERSION (flags, ch, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2885

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2886 CODING_STREAM_COMPOSE (str, flags, ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2887 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2888

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2889 /* Convert internally-formatted data to Big5. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2890

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2891 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2892 encode_coding_big5 (Lstream *encoding, CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2893 unsigned_char_dynarr *dst, unsigned int n)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2894 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2895 unsigned char c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2896 struct encoding_stream *str = ENCODING_STREAM_DATA (encoding);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2897 unsigned int flags, ch, eol;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2898

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2899 CODING_STREAM_DECOMPOSE (str, flags, ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2900 eol = CODING_SYSTEM_EOL_TYPE (str->codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2901

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2902 while (n--)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2903 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2904 c = *src++;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2905 if (c == '\n')

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2906 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2907 if (eol != EOL_LF && eol != EOL_AUTODETECT)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2908 Dynarr_add (dst, '\r');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2909 if (eol != EOL_CR)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2910 Dynarr_add (dst, '\n');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2911 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2912 else if (BYTE_ASCII_P (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2913 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2914 /* ASCII. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2915 Dynarr_add (dst, c);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2916 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2917 else if (BUFBYTE_LEADING_BYTE_P (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2918 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2919 if (c == LEADING_BYTE_CHINESE_BIG5_1 ||

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2920 c == LEADING_BYTE_CHINESE_BIG5_2)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2921 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2922 /* A recognized leading byte. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2923 ch = c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2924 continue; /* not done with this character. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2925 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2926 /* otherwise just ignore this character. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2927 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2928 else if (ch == LEADING_BYTE_CHINESE_BIG5_1 ||

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2929 ch == LEADING_BYTE_CHINESE_BIG5_2)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2930 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2931 /* Previous char was a recognized leading byte. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2932 ch = (ch << 8) | c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2933 continue; /* not done with this character. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2934 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2935 else if (ch)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2936 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2937 /* Encountering second byte of a Big5 character. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2938 unsigned char b1, b2;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2939

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2940 ENCODE_BIG5 (ch >> 8, ch & 0xFF, c, b1, b2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2941 Dynarr_add (dst, b1);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2942 Dynarr_add (dst, b2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2943 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2944

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2945 ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2946 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2947

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2948 CODING_STREAM_COMPOSE (str, flags, ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2949 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2950

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2951

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2952 DEFUN ("decode-big5-char", Fdecode_big5_char, 1, 1, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2953 Decode a Big5 character CODE of BIG5 coding-system.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2954 CODE is the character code in BIG5.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2955 Return the corresponding character.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2956 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2957 (code))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2958 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2959 unsigned char c1, c2, b1, b2;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2960 Lisp_Object charset;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2961

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2962 CHECK_CONS (code);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2963 CHECK_INT (XCAR (code));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2964 CHECK_INT (XCDR (code));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2965 b1 = XINT (XCAR (code));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2966 b2 = XINT (XCDR (code));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2967 if (BYTE_BIG5_TWO_BYTE_1_P (b1) &&

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2968 BYTE_BIG5_TWO_BYTE_2_P (b2))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2969 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2970 DECODE_BIG5 (b1, b2, XCHARSET_LEADING_BYTE (charset), c1, c2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2971 return make_char (MAKE_CHAR (charset, c1 & 0x7F, c2 & 0x7F));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2972 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2973 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2974 return Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2975 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2976

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2977 DEFUN ("encode-big5-char", Fencode_big5_char, 1, 1, 0, /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2978 Encode the Big5 character CH to BIG5 coding-system.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2979 Return the corresponding character code in Big5.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2980 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2981 (ch))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2982 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2983 Lisp_Object charset;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2984 int c1, c2, b1, b2;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2985

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2986 CHECK_CHAR_COERCE_INT (ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2987 BREAKUP_CHAR (XCHAR (ch), charset, c1, c2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2988 if (EQ (charset, Vcharset_chinese_big5_1) ||

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2989 EQ (charset, Vcharset_chinese_big5_2))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2990 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2991 ENCODE_BIG5 (XCHARSET_LEADING_BYTE (charset), c1 | 0x80, c2 | 0x80,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2992 b1, b2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2993 return Fcons (make_int (b1), make_int (b2));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2994 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2995 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2996 return Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2997 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2998

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

2999

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3000 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3001 /* ISO2022 methods */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3002 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3003

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3004 /* The following note describes the coding system ISO2022 briefly.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3005 Since the intention of this note is to help understanding of the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3006 programs in this file, some parts are NOT ACCURATE or OVERLY

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3007 SIMPLIFIED. For thorough understanding, please refer to the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3008 original document of ISO2022.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3009

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3010 ISO2022 provides many mechanisms to encode several character sets

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3011 in 7-bit and 8-bit environments. If one chooses 7-bit environment,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3012 all text is encoded by codes of less than 128. This may make the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3013 encoded text a little bit longer, but the text get more stability

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3014 to pass through several gateways (some of them strip off MSB).

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3015

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3016 There are two kind of character sets: control character set and

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3017 graphic character set. The former contains control characters such

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3018 as `newline' and `escape' to provide control functions (control

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3019 functions are provided also by escape sequence). The latter

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3020 contains graphic characters such as 'A' and '-'. Emacs recognizes

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3021 two control character sets and many graphic character sets.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3022

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3023 Graphic character sets are classified into one of four types,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3024 according to the dimension and number of characters in the set:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3025 TYPE94, TYPE96, TYPE94x94, and TYPE96x96. In addition, each

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3026 character set is assigned an identification byte, unique for each

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3027 type, called "final character" (denoted as <F> hereafter). The <F>

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3028 of each character set is decided by ECMA(*) when it is registered

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3029 in ISO. Code range of <F> is 0x30..0x7F (0x30..0x3F are for

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3030 private use only).

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3031

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3032 Note (*): ECMA = European Computer Manufacturers Association

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3033

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3034 Here are examples of graphic character set [NAME(<F>)]:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3035 o TYPE94 -- ASCII('B'), right-half-of-JISX0201('I'), ...

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3036 o TYPE96 -- right-half-of-ISO8859-1('A'), ...

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3037 o TYPE94x94 -- GB2312('A'), JISX0208('B'), ...

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3038 o TYPE96x96 -- none for the moment

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3039

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3040 A code area (1byte=8bits) is divided into 4 areas, C0, GL, C1, and GR.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3041 C0 [0x00..0x1F] -- control character plane 0

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3042 GL [0x20..0x7F] -- graphic character plane 0

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3043 C1 [0x80..0x9F] -- control character plane 1

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3044 GR [0xA0..0xFF] -- graphic character plane 1

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3045

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3046 A control character set is directly designated and invoked to C0 or

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3047 C1 by an escape sequence. The most common case is that:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3048 - ISO646's control character set is designated/invoked to C0, and

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3049 - ISO6429's control character set is designated/invoked to C1,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3050 and usually these designations/invocations are omitted in encoded

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3051 text. In a 7-bit environment, only C0 can be used, and a control

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3052 character for C1 is encoded by an appropriate escape sequence to

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3053 fit into the environment. All control characters for C1 are

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3054 defined to have corresponding escape sequences.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3055

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3056 A graphic character set is at first designated to one of four

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3057 graphic registers (G0 through G3), then these graphic registers are

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3058 invoked to GL or GR. These designations and invocations can be

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3059 done independently. The most common case is that G0 is invoked to

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3060 GL, G1 is invoked to GR, and ASCII is designated to G0. Usually

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3061 these invocations and designations are omitted in encoded text.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3062 In a 7-bit environment, only GL can be used.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3063

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3064 When a graphic character set of TYPE94 or TYPE94x94 is invoked to

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3065 GL, codes 0x20 and 0x7F of the GL area work as control characters

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3066 SPACE and DEL respectively, and code 0xA0 and 0xFF of GR area

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3067 should not be used.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3068

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3069 There are two ways of invocation: locking-shift and single-shift.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3070 With locking-shift, the invocation lasts until the next different

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3071 invocation, whereas with single-shift, the invocation works only

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3072 for the following character and doesn't affect locking-shift.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3073 Invocations are done by the following control characters or escape

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3074 sequences.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3075

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3076 ----------------------------------------------------------------------

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3077 abbrev function cntrl escape seq description

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3078 ----------------------------------------------------------------------

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3079 SI/LS0 (shift-in) 0x0F none invoke G0 into GL

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3080 SO/LS1 (shift-out) 0x0E none invoke G1 into GL

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3081 LS1R (locking-shift-1 right) none ESC '~' invoke G1 into GR

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3082 LS2 (locking-shift-2) none ESC 'n' invoke G2 into GL

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3083 LS2R (locking-shift-2 right) none ESC '}' invoke G2 into GR

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3084 LS3 (locking-shift-3) none ESC 'o' invoke G3 into GL

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3085 LS3R (locking-shift 3 right) none ESC '|' invoke G3 into GR

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3086 SS2 (single-shift-2) 0x8E ESC 'N' invoke G2 for one char

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3087 SS3 (single-shift-3) 0x8F ESC 'O' invoke G3 for one char

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3088 ----------------------------------------------------------------------

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3089 The first four are for locking-shift. Control characters for these

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3090 functions are defined by macros ISO_CODE_XXX in `coding.h'.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3091

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3092 Designations are done by the following escape sequences.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3093 ----------------------------------------------------------------------

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3094 escape sequence description

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3095 ----------------------------------------------------------------------

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3096 ESC '(' <F> designate TYPE94<F> to G0

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3097 ESC ')' <F> designate TYPE94<F> to G1

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3098 ESC '*' <F> designate TYPE94<F> to G2

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3099 ESC '+' <F> designate TYPE94<F> to G3

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3100 ESC ',' <F> designate TYPE96<F> to G0 (*)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3101 ESC '-' <F> designate TYPE96<F> to G1

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3102 ESC '.' <F> designate TYPE96<F> to G2

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3103 ESC '/' <F> designate TYPE96<F> to G3

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3104 ESC '$' '(' <F> designate TYPE94x94<F> to G0 (**)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3105 ESC '$' ')' <F> designate TYPE94x94<F> to G1

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3106 ESC '$' '*' <F> designate TYPE94x94<F> to G2

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3107 ESC '$' '+' <F> designate TYPE94x94<F> to G3

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3108 ESC '$' ',' <F> designate TYPE96x96<F> to G0 (*)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3109 ESC '$' '-' <F> designate TYPE96x96<F> to G1

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3110 ESC '$' '.' <F> designate TYPE96x96<F> to G2

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3111 ESC '$' '/' <F> designate TYPE96x96<F> to G3

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3112 ----------------------------------------------------------------------

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3113 In this list, "TYPE94<F>" means a graphic character set of type TYPE94

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3114 and final character <F>, and etc.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3115

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3116 Note (*): Although these designations are not allowed in ISO2022,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3117 Emacs accepts them on decoding, and produces them on encoding

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3118 TYPE96 or TYPE96x96 character set in a coding system which is

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3119 characterized as 7-bit environment, non-locking-shift, and

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3120 non-single-shift.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3121

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3122 Note (**): If <F> is '@', 'A', or 'B', the intermediate character

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3123 '(' can be omitted. We call this as "short-form" here after.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3124

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3125 Now you may notice that there are a lot of ways for encoding the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3126 same multilingual text in ISO2022. Actually, there exist many

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3127 coding systems such as Compound Text (used in X's inter client

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3128 communication, ISO-2022-JP (used in Japanese internet), ISO-2022-KR

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3129 (used in Korean internet), EUC (Extended UNIX Code, used in Asian

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3130 localized platforms), and all of these are variants of ISO2022.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3131

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3132 In addition to the above, Emacs handles two more kinds of escape

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3133 sequences: ISO6429's direction specification and Emacs' private

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3134 sequence for specifying character composition.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3135

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3136 ISO6429's direction specification takes the following format:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3137 o CSI ']' -- end of the current direction

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3138 o CSI '0' ']' -- end of the current direction

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3139 o CSI '1' ']' -- start of left-to-right text

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3140 o CSI '2' ']' -- start of right-to-left text

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3141 The control character CSI (0x9B: control sequence introducer) is

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3142 abbreviated to the escape sequence ESC '[' in 7-bit environment.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3143

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3144 Character composition specification takes the following format:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3145 o ESC '0' -- start character composition

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3146 o ESC '1' -- end character composition

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3147 Since these are not standard escape sequences of any ISO, the use

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3148 of them for these meanings is restricted to Emacs only. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3149

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3150 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3151 reset_iso2022 (Lisp_Object coding_system, struct iso2022_decoder *iso)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3152 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3153 int i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3154

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3155 for (i = 0; i < 4; i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3156 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3157 if (!NILP (coding_system))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3158 iso->charset[i] =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3159 XCODING_SYSTEM_ISO2022_INITIAL_CHARSET (coding_system, i);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3160 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3161 iso->charset[i] = Qt;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3162 iso->invalid_designated[i] = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3163 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3164 iso->esc = ISO_ESC_NOTHING;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3165 iso->esc_bytes_index = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3166 iso->register_left = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3167 iso->register_right = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3168 iso->switched_dir_and_no_valid_charset_yet = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3169 iso->invalid_switch_dir = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3170 iso->output_direction_sequence = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3171 iso->output_literally = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3172 if (iso->composite_chars)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3173 Dynarr_reset (iso->composite_chars);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3174 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3175

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3176 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3177 fit_to_be_escape_quoted (unsigned char c)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3178 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3179 switch (c)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3180 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3181 case ISO_CODE_ESC:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3182 case ISO_CODE_CSI:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3183 case ISO_CODE_SS2:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3184 case ISO_CODE_SS3:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3185 case ISO_CODE_SO:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3186 case ISO_CODE_SI:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3187 return 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3188

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3189 default:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3190 return 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3191 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3192 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3193

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3194 /* Parse one byte of an ISO2022 escape sequence.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3195 If the result is an invalid escape sequence, return 0 and

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3196 do not change anything in STR. Otherwise, if the result is

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3197 an incomplete escape sequence, update ISO2022.ESC and

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3198 ISO2022.ESC_BYTES and return -1. Otherwise, update

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3199 all the state variables (but not ISO2022.ESC_BYTES) and

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3200 return 1.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3201

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3202 If CHECK_INVALID_CHARSETS is non-zero, check for designation

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3203 or invocation of an invalid character set and treat that as

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3204 an unrecognized escape sequence. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3205

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3206 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3207 parse_iso2022_esc (Lisp_Object codesys, struct iso2022_decoder *iso,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3208 unsigned char c, unsigned int *flags,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3209 int check_invalid_charsets)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3210 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3211 /* (1) If we're at the end of a designation sequence, CS is the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3212 charset being designated and REG is the register to designate

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3213 it to.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3214

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3215 (2) If we're at the end of a locking-shift sequence, REG is

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3216 the register to invoke and HALF (0 == left, 1 == right) is

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3217 the half to invoke it into.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3218

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3219 (3) If we're at the end of a single-shift sequence, REG is

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3220 the register to invoke. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3221 Lisp_Object cs = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3222 int reg, half;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3223

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3224 /* NOTE: This code does goto's all over the fucking place.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3225 The reason for this is that we're basically implementing

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3226 a state machine here, and hierarchical languages like C

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3227 don't really provide a clean way of doing this. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3228

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3229 if (! (*flags & CODING_STATE_ESCAPE))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3230 /* At beginning of escape sequence; we need to reset our

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3231 escape-state variables. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3232 iso->esc = ISO_ESC_NOTHING;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3233

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3234 iso->output_literally = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3235 iso->output_direction_sequence = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3236

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3237 switch (iso->esc)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3238 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3239 case ISO_ESC_NOTHING:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3240 iso->esc_bytes_index = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3241 switch (c)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3242 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3243 case ISO_CODE_ESC: /* Start escape sequence */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3244 *flags |= CODING_STATE_ESCAPE;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3245 iso->esc = ISO_ESC;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3246 goto not_done;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3247

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3248 case ISO_CODE_CSI: /* ISO6429 (specifying directionality) */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3249 *flags |= CODING_STATE_ESCAPE;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3250 iso->esc = ISO_ESC_5_11;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3251 goto not_done;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3252

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3253 case ISO_CODE_SO: /* locking shift 1 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3254 reg = 1; half = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3255 goto locking_shift;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3256 case ISO_CODE_SI: /* locking shift 0 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3257 reg = 0; half = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3258 goto locking_shift;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3259

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3260 case ISO_CODE_SS2: /* single shift */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3261 reg = 2;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3262 goto single_shift;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3263 case ISO_CODE_SS3: /* single shift */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3264 reg = 3;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3265 goto single_shift;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3266

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3267 default: /* Other control characters */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3268 return 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3269 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3270

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3271 case ISO_ESC:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3272 switch (c)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3273 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3274 /**** single shift ****/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3275

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3276 case 'N': /* single shift 2 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3277 reg = 2;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3278 goto single_shift;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3279 case 'O': /* single shift 3 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3280 reg = 3;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3281 goto single_shift;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3282

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3283 /**** locking shift ****/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3284

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3285 case '~': /* locking shift 1 right */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3286 reg = 1; half = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3287 goto locking_shift;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3288 case 'n': /* locking shift 2 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3289 reg = 2; half = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3290 goto locking_shift;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3291 case '}': /* locking shift 2 right */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3292 reg = 2; half = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3293 goto locking_shift;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3294 case 'o': /* locking shift 3 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3295 reg = 3; half = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3296 goto locking_shift;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3297 case '|': /* locking shift 3 right */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3298 reg = 3; half = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3299 goto locking_shift;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3300

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3301 /**** composite ****/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3302

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3303 case '0':

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3304 iso->esc = ISO_ESC_START_COMPOSITE;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3305 *flags = (*flags & CODING_STATE_ISO2022_LOCK) |

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3306 CODING_STATE_COMPOSITE;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3307 return 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3308

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3309 case '1':

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3310 iso->esc = ISO_ESC_END_COMPOSITE;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3311 *flags = (*flags & CODING_STATE_ISO2022_LOCK) &

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3312 ~CODING_STATE_COMPOSITE;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3313 return 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3314

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3315 /**** directionality ****/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3316

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3317 case '[':

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3318 iso->esc = ISO_ESC_5_11;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3319 goto not_done;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3320

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3321 /**** designation ****/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3322

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3323 case '$': /* multibyte charset prefix */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3324 iso->esc = ISO_ESC_2_4;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3325 goto not_done;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3326

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3327 default:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3328 if (0x28 <= c && c <= 0x2F)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3329 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3330 iso->esc = c - 0x28 + ISO_ESC_2_8;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3331 goto not_done;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3332 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3333

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3334 /* This function is called with CODESYS equal to nil when

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3335 doing coding-system detection. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3336 if (!NILP (codesys)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3337 && XCODING_SYSTEM_ISO2022_ESCAPE_QUOTED (codesys)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3338 && fit_to_be_escape_quoted (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3339 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3340 iso->esc = ISO_ESC_LITERAL;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3341 *flags &= CODING_STATE_ISO2022_LOCK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3342 return 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3343 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3344

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3345 /* bzzzt! */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3346 return 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3347 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3348

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3349

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3350

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3351 /**** directionality ****/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3352

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3353 case ISO_ESC_5_11: /* ISO6429 direction control */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3354 if (c == ']')

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3355 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3356 *flags &= (CODING_STATE_ISO2022_LOCK & ~CODING_STATE_R2L);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3357 goto directionality;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3358 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3359 if (c == '0') iso->esc = ISO_ESC_5_11_0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3360 else if (c == '1') iso->esc = ISO_ESC_5_11_1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3361 else if (c == '2') iso->esc = ISO_ESC_5_11_2;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3362 else return 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3363 goto not_done;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3364

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3365 case ISO_ESC_5_11_0:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3366 if (c == ']')

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3367 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3368 *flags &= (CODING_STATE_ISO2022_LOCK & ~CODING_STATE_R2L);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3369 goto directionality;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3370 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3371 return 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3372

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3373 case ISO_ESC_5_11_1:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3374 if (c == ']')

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3375 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3376 *flags = (CODING_STATE_ISO2022_LOCK & ~CODING_STATE_R2L);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3377 goto directionality;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3378 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3379 return 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3380

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3381 case ISO_ESC_5_11_2:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3382 if (c == ']')

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3383 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3384 *flags = (*flags & CODING_STATE_ISO2022_LOCK) | CODING_STATE_R2L;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3385 goto directionality;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3386 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3387 return 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3388

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3389 directionality:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3390 iso->esc = ISO_ESC_DIRECTIONALITY;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3391 /* Various junk here to attempt to preserve the direction sequences

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3392 literally in the text if they would otherwise be swallowed due

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3393 to invalid designations that don't show up as actual charset

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3394 changes in the text. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3395 if (iso->invalid_switch_dir)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3396 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3397 /* We already inserted a direction switch literally into the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3398 text. We assume (#### this may not be right) that the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3399 next direction switch is the one going the other way,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3400 and we need to output that literally as well. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3401 iso->output_literally = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3402 iso->invalid_switch_dir = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3403 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3404 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3405 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3406 int jj;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3407

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3408 /* If we are in the thrall of in invalid designation,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3409 then stick the directionality sequence literally into the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3410 output stream so it ends up in the original text again. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3411 for (jj = 0; jj < 4; jj++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3412 if (iso->invalid_designated[jj])

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3413 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3414 if (jj < 4)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3415 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3416 iso->output_literally = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3417 iso->invalid_switch_dir = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3418 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3419 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3420 /* Indicate that we haven't yet seen a valid designation,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3421 so that if a switch-dir is directly followed by an

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3422 invalid designation, both get inserted literally. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3423 iso->switched_dir_and_no_valid_charset_yet = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3424 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3425 return 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3426

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3427

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3428 /**** designation ****/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3429

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3430 case ISO_ESC_2_4:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3431 if (0x28 <= c && c <= 0x2F)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3432 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3433 iso->esc = c - 0x28 + ISO_ESC_2_4_8;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3434 goto not_done;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3435 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3436 if (0x40 <= c && c <= 0x42)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3437 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3438 cs = CHARSET_BY_ATTRIBUTES (CHARSET_TYPE_94X94, c,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3439 *flags & CODING_STATE_R2L ?

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3440 CHARSET_RIGHT_TO_LEFT :

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3441 CHARSET_LEFT_TO_RIGHT);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3442 reg = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3443 goto designated;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3444 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3445 return 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3446

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3447 default:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3448 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3449 int type;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3450

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3451 if (c < '0' || c > '~')

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3452 return 0; /* bad final byte */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3453

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3454 if (iso->esc >= ISO_ESC_2_8 &&

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3455 iso->esc <= ISO_ESC_2_15)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3456 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3457 if (iso->esc >= ISO_ESC_2_12)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3458 type = CHARSET_TYPE_96;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3459 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3460 type = CHARSET_TYPE_94;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3461 reg = (iso->esc - ISO_ESC_2_8) & 3;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3462 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3463 else if (iso->esc >= ISO_ESC_2_4_8 &&

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3464 iso->esc <= ISO_ESC_2_4_15)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3465 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3466 if (iso->esc >= ISO_ESC_2_4_12)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3467 type = CHARSET_TYPE_96X96;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3468 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3469 type = CHARSET_TYPE_94X94;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3470 reg = (iso->esc - ISO_ESC_2_4_8) & 3;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3471 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3472

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3473 cs = CHARSET_BY_ATTRIBUTES (type, c,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3474 *flags & CODING_STATE_R2L ?

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3475 CHARSET_RIGHT_TO_LEFT :

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3476 CHARSET_LEFT_TO_RIGHT);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3477 goto designated;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3478 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3479 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3480

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3481 not_done:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3482 iso->esc_bytes[iso->esc_bytes_index++] = (unsigned char) c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3483 return -1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3484

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3485 single_shift:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3486 if (check_invalid_charsets && !CHARSETP (iso->charset[reg]))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3487 /* can't invoke something that ain't there. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3488 return 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3489 iso->esc = ISO_ESC_SINGLE_SHIFT;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3490 *flags &= CODING_STATE_ISO2022_LOCK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3491 if (reg == 2)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3492 *flags |= CODING_STATE_SS2;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3493 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3494 *flags |= CODING_STATE_SS3;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3495 return 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3496

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3497 locking_shift:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3498 if (check_invalid_charsets &&

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3499 !CHARSETP (iso->charset[reg]))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3500 /* can't invoke something that ain't there. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3501 return 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3502 if (half)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3503 iso->register_right = reg;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3504 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3505 iso->register_left = reg;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3506 *flags &= CODING_STATE_ISO2022_LOCK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3507 iso->esc = ISO_ESC_LOCKING_SHIFT;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3508 return 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3509

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3510 designated:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3511 if (NILP (cs) && check_invalid_charsets)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3512 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3513 iso->invalid_designated[reg] = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3514 iso->charset[reg] = Vcharset_ascii;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3515 iso->esc = ISO_ESC_DESIGNATE;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3516 *flags &= CODING_STATE_ISO2022_LOCK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3517 iso->output_literally = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3518 if (iso->switched_dir_and_no_valid_charset_yet)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3519 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3520 /* We encountered a switch-direction followed by an

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3521 invalid designation. Ensure that the switch-direction

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3522 gets outputted; otherwise it will probably get eaten

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3523 when the text is written out again. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3524 iso->switched_dir_and_no_valid_charset_yet = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3525 iso->output_direction_sequence = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3526 /* And make sure that the switch-dir going the other

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3527 way gets outputted, as well. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3528 iso->invalid_switch_dir = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3529 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3530 return 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3531 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3532 /* This function is called with CODESYS equal to nil when

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3533 doing coding-system detection. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3534 if (!NILP (codesys))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3535 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3536 charset_conversion_spec_dynarr *dyn =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3537 XCODING_SYSTEM (codesys)->iso2022.input_conv;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3538

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3539 if (dyn)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3540 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3541 int i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3542

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3543 for (i = 0; i < Dynarr_length (dyn); i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3544 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3545 struct charset_conversion_spec *spec = Dynarr_atp (dyn, i);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3546 if (EQ (cs, spec->from_charset))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3547 cs = spec->to_charset;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3548 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3549 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3550 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3551

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3552 iso->charset[reg] = cs;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3553 iso->esc = ISO_ESC_DESIGNATE;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3554 *flags &= CODING_STATE_ISO2022_LOCK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3555 if (iso->invalid_designated[reg])

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3556 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3557 iso->invalid_designated[reg] = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3558 iso->output_literally = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3559 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3560 if (iso->switched_dir_and_no_valid_charset_yet)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3561 iso->switched_dir_and_no_valid_charset_yet = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3562 return 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3563 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3564

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3565 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3566 detect_coding_iso2022 (struct detection_state *st, CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3567 unsigned int n)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3568 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3569 int c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3570 int mask;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3571

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3572 /* #### There are serious deficiencies in the recognition mechanism

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3573 here. This needs to be much smarter if it's going to cut it. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3574

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3575 if (!st->iso2022.initted)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3576 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3577 reset_iso2022 (Qnil, &st->iso2022.iso);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3578 st->iso2022.mask = (CODING_CATEGORY_ISO_7_MASK |

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3579 CODING_CATEGORY_ISO_8_DESIGNATE_MASK |

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3580 CODING_CATEGORY_ISO_8_1_MASK |

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3581 CODING_CATEGORY_ISO_8_2_MASK |

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3582 CODING_CATEGORY_ISO_LOCK_SHIFT_MASK);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3583 st->iso2022.flags = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3584 st->iso2022.high_byte_count = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3585 st->iso2022.saw_single_shift = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3586 st->iso2022.initted = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3587 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3588

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3589 mask = st->iso2022.mask;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3590

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3591 while (n--)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3592 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3593 c = *src++;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3594 if (c >= 0xA0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3595 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3596 mask &= ~CODING_CATEGORY_ISO_7_MASK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3597 st->iso2022.high_byte_count++;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3598 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3599 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3600 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3601 if (st->iso2022.high_byte_count && !st->iso2022.saw_single_shift)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3602 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3603 if (st->iso2022.high_byte_count & 1)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3604 /* odd number of high bytes; assume not iso-8-2 */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3605 mask &= ~CODING_CATEGORY_ISO_8_2_MASK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3606 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3607 st->iso2022.high_byte_count = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3608 st->iso2022.saw_single_shift = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3609 if (c > 0x80)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3610 mask &= ~CODING_CATEGORY_ISO_7_MASK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3611 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3612 if (!(st->iso2022.flags & CODING_STATE_ESCAPE)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3613 && (BYTE_C0_P (c) || BYTE_C1_P (c)))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3614 { /* control chars */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3615 switch (c)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3616 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3617 /* Allow and ignore control characters that you might

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3618 reasonably see in a text file */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3619 case '\r':

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3620 case '\n':

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3621 case '\t':

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3622 case 7: /* bell */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3623 case 8: /* backspace */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3624 case 11: /* vertical tab */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3625 case 12: /* form feed */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3626 case 26: /* MS-DOS C-z junk */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3627 goto label_continue_loop;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3628

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3629 default:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3630 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3631 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3632 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3633

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3634 if ((st->iso2022.flags & CODING_STATE_ESCAPE) || BYTE_C0_P (c)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3635 || BYTE_C1_P (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3636 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3637 if (parse_iso2022_esc (Qnil, &st->iso2022.iso, c,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3638 &st->iso2022.flags, 0))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3639 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3640 switch (st->iso2022.iso.esc)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3641 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3642 case ISO_ESC_DESIGNATE:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3643 mask &= ~CODING_CATEGORY_ISO_8_1_MASK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3644 mask &= ~CODING_CATEGORY_ISO_8_2_MASK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3645 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3646 case ISO_ESC_LOCKING_SHIFT:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3647 mask = CODING_CATEGORY_ISO_LOCK_SHIFT_MASK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3648 goto ran_out_of_chars;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3649 case ISO_ESC_SINGLE_SHIFT:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3650 mask &= ~CODING_CATEGORY_ISO_8_DESIGNATE_MASK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3651 st->iso2022.saw_single_shift = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3652 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3653 default:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3654 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3655 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3656 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3657 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3658 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3659 mask = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3660 goto ran_out_of_chars;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3661 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3662 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3663 label_continue_loop:;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3664 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3665

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3666 ran_out_of_chars:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3667

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3668 return mask;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3669 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3670

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3671 static int

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3672 postprocess_iso2022_mask (int mask)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3673 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3674 /* #### kind of cheesy */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3675 /* If seven-bit ISO is allowed, then assume that the encoding is

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3676 entirely seven-bit and turn off the eight-bit ones. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3677 if (mask & CODING_CATEGORY_ISO_7_MASK)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3678 mask &= ~ (CODING_CATEGORY_ISO_8_DESIGNATE_MASK |

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3679 CODING_CATEGORY_ISO_8_1_MASK |

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3680 CODING_CATEGORY_ISO_8_2_MASK);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3681 return mask;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3682 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3683

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3684 /* If FLAGS is a null pointer or specifies right-to-left motion,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3685 output a switch-dir-to-left-to-right sequence to DST.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3686 Also update FLAGS if it is not a null pointer.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3687 If INTERNAL_P is set, we are outputting in internal format and

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3688 need to handle the CSI differently. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3689

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3690 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3691 restore_left_to_right_direction (struct Lisp_Coding_System *codesys,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3692 unsigned_char_dynarr *dst,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3693 unsigned int *flags,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3694 int internal_p)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3695 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3696 if (!flags || (*flags & CODING_STATE_R2L))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3697 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3698 if (CODING_SYSTEM_ISO2022_SEVEN (codesys))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3699 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3700 Dynarr_add (dst, ISO_CODE_ESC);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3701 Dynarr_add (dst, '[');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3702 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3703 else if (internal_p)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3704 DECODE_ADD_BINARY_CHAR (ISO_CODE_CSI, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3705 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3706 Dynarr_add (dst, ISO_CODE_CSI);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3707 Dynarr_add (dst, '0');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3708 Dynarr_add (dst, ']');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3709 if (flags)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3710 *flags &= ~CODING_STATE_R2L;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3711 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3712 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3713

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3714 /* If FLAGS is a null pointer or specifies a direction different from

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3715 DIRECTION (which should be either CHARSET_RIGHT_TO_LEFT or

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3716 CHARSET_LEFT_TO_RIGHT), output the appropriate switch-dir escape

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3717 sequence to DST. Also update FLAGS if it is not a null pointer.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3718 If INTERNAL_P is set, we are outputting in internal format and

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3719 need to handle the CSI differently. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3720

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3721 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3722 ensure_correct_direction (int direction, struct Lisp_Coding_System *codesys,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3723 unsigned_char_dynarr *dst, unsigned int *flags,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3724 int internal_p)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3725 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3726 if ((!flags || (*flags & CODING_STATE_R2L)) &&

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3727 direction == CHARSET_LEFT_TO_RIGHT)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3728 restore_left_to_right_direction (codesys, dst, flags, internal_p);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3729 else if (!CODING_SYSTEM_ISO2022_NO_ISO6429 (codesys)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3730 && (!flags || !(*flags & CODING_STATE_R2L)) &&

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3731 direction == CHARSET_RIGHT_TO_LEFT)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3732 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3733 if (CODING_SYSTEM_ISO2022_SEVEN (codesys))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3734 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3735 Dynarr_add (dst, ISO_CODE_ESC);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3736 Dynarr_add (dst, '[');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3737 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3738 else if (internal_p)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3739 DECODE_ADD_BINARY_CHAR (ISO_CODE_CSI, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3740 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3741 Dynarr_add (dst, ISO_CODE_CSI);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3742 Dynarr_add (dst, '2');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3743 Dynarr_add (dst, ']');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3744 if (flags)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3745 *flags |= CODING_STATE_R2L;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3746 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3747 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3748

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3749 /* Convert ISO2022-format data to internal format. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3750

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3751 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3752 decode_coding_iso2022 (Lstream *decoding, CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3753 unsigned_char_dynarr *dst, unsigned int n)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3754 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3755 unsigned char c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3756 unsigned int flags, ch;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3757 int eol;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3758 struct decoding_stream *str = DECODING_STREAM_DATA (decoding);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3759 Lisp_Object coding_system = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3760 unsigned_char_dynarr *real_dst = dst;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3761

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3762 CODING_STREAM_DECOMPOSE (str, flags, ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3763 eol = CODING_SYSTEM_EOL_TYPE (str->codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3764 XSETCODING_SYSTEM (coding_system, str->codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3765

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3766 if (flags & CODING_STATE_COMPOSITE)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3767 dst = str->iso2022.composite_chars;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3768

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3769 while (n--)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3770 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3771 c = *src++;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3772 if (flags & CODING_STATE_ESCAPE)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3773 { /* Within ESC sequence */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3774 int retval;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3775

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3776 retval = parse_iso2022_esc (coding_system, &str->iso2022,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3777 c, &flags, 1);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3778

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3779 if (retval)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3780 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3781 switch (str->iso2022.esc)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3782 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3783 case ISO_ESC_START_COMPOSITE:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3784 if (str->iso2022.composite_chars)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3785 Dynarr_reset (str->iso2022.composite_chars);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3786 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3787 str->iso2022.composite_chars = Dynarr_new (unsigned char);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3788 dst = str->iso2022.composite_chars;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3789 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3790 case ISO_ESC_END_COMPOSITE:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3791 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3792 Bufbyte comstr[MAX_EMCHAR_LEN];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3793 Bytecount len;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3794 Emchar emch = lookup_composite_char (Dynarr_atp (dst, 0),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3795 Dynarr_length (dst));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3796 dst = real_dst;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3797 len = set_charptr_emchar (comstr, emch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3798 Dynarr_add_many (dst, comstr, len);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3799 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3800 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3801

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3802 case ISO_ESC_LITERAL:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3803 DECODE_ADD_BINARY_CHAR (c, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3804 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3805

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3806 default:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3807 /* Everything else handled already */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3808 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3809 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3810 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3811

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3812 /* Attempted error recovery. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3813 if (str->iso2022.output_direction_sequence)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3814 ensure_correct_direction (flags & CODING_STATE_R2L ?

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3815 CHARSET_RIGHT_TO_LEFT :

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3816 CHARSET_LEFT_TO_RIGHT,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3817 str->codesys, dst, 0, 1);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3818 /* More error recovery. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3819 if (!retval || str->iso2022.output_literally)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3820 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3821 /* Output the (possibly invalid) sequence */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3822 int i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3823 for (i = 0; i < str->iso2022.esc_bytes_index; i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3824 DECODE_ADD_BINARY_CHAR (str->iso2022.esc_bytes[i], dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3825 flags &= CODING_STATE_ISO2022_LOCK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3826 if (!retval)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3827 n++, src--;/* Repeat the loop with the same character. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3828 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3829 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3830 /* No sense in reprocessing the final byte of the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3831 escape sequence; it could mess things up anyway.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3832 Just add it now. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3833 DECODE_ADD_BINARY_CHAR (c, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3834 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3835 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3836 ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3837 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3838 else if (BYTE_C0_P (c) || BYTE_C1_P (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3839 { /* Control characters */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3840

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3841 /***** Error-handling *****/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3842

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3843 /* If we were in the middle of a character, dump out the

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3844 partial character. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3845 DECODE_OUTPUT_PARTIAL_CHAR (ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3846

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3847 /* If we just saw a single-shift character, dump it out.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3848 This may dump out the wrong sort of single-shift character,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3849 but least it will give an indication that something went

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3850 wrong. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3851 if (flags & CODING_STATE_SS2)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3852 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3853 DECODE_ADD_BINARY_CHAR (ISO_CODE_SS2, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3854 flags &= ~CODING_STATE_SS2;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3855 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3856 if (flags & CODING_STATE_SS3)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3857 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3858 DECODE_ADD_BINARY_CHAR (ISO_CODE_SS3, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3859 flags &= ~CODING_STATE_SS3;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3860 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3861

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3862 /***** Now handle the control characters. *****/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3863

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3864 /* Handle CR/LF */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3865 DECODE_HANDLE_EOL_TYPE (eol, c, flags, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3866

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3867 flags &= CODING_STATE_ISO2022_LOCK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3868

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3869 if (!parse_iso2022_esc (coding_system, &str->iso2022, c, &flags, 1))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3870 DECODE_ADD_BINARY_CHAR (c, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3871 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3872 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3873 { /* Graphic characters */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3874 Lisp_Object charset;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3875 int lb;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3876 int reg;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3877

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3878 DECODE_HANDLE_EOL_TYPE (eol, c, flags, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3879

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3880 /* Now determine the charset. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3881 reg = ((flags & CODING_STATE_SS2) ? 2

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3882 : (flags & CODING_STATE_SS3) ? 3

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3883 : !BYTE_ASCII_P (c) ? str->iso2022.register_right

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3884 : str->iso2022.register_left);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3885 charset = str->iso2022.charset[reg];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3886

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3887 /* Error checking: */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3888 if (NILP (charset) || str->iso2022.invalid_designated[reg]

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3889 || (((c & 0x7F) == ' ' || (c & 0x7F) == ISO_CODE_DEL)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3890 && XCHARSET_CHARS (charset) == 94))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3891 /* Mrmph. We are trying to invoke a register that has no

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3892 or an invalid charset in it, or trying to add a character

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3893 outside the range of the charset. Insert that char literally

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3894 to preserve it for the output. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3895 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3896 DECODE_OUTPUT_PARTIAL_CHAR (ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3897 DECODE_ADD_BINARY_CHAR (c, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3898 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3899

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3900 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3901 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3902 /* Things are probably hunky-dorey. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3903

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3904 /* Fetch reverse charset, maybe. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3905 if (((flags & CODING_STATE_R2L) &&

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3906 XCHARSET_DIRECTION (charset) == CHARSET_LEFT_TO_RIGHT)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3907 ||

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3908 (!(flags & CODING_STATE_R2L) &&

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3909 XCHARSET_DIRECTION (charset) == CHARSET_RIGHT_TO_LEFT))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3910 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3911 Lisp_Object new_charset =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3912 XCHARSET_REVERSE_DIRECTION_CHARSET (charset);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3913 if (!NILP (new_charset))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3914 charset = new_charset;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3915 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3916

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3917 lb = XCHARSET_LEADING_BYTE (charset);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3918 switch (XCHARSET_REP_BYTES (charset))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3919 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3920 case 1: /* ASCII */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3921 DECODE_OUTPUT_PARTIAL_CHAR (ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3922 Dynarr_add (dst, c & 0x7F);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3923 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3924

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3925 case 2: /* one-byte official */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3926 DECODE_OUTPUT_PARTIAL_CHAR (ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3927 Dynarr_add (dst, lb);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3928 Dynarr_add (dst, c | 0x80);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3929 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3930

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3931 case 3: /* one-byte private or two-byte official */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3932 if (XCHARSET_PRIVATE_P (charset))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3933 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3934 DECODE_OUTPUT_PARTIAL_CHAR (ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3935 Dynarr_add (dst, PRE_LEADING_BYTE_PRIVATE_1);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3936 Dynarr_add (dst, lb);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3937 Dynarr_add (dst, c | 0x80);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3938 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3939 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3940 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3941 if (ch)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3942 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3943 Dynarr_add (dst, lb);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3944 Dynarr_add (dst, ch | 0x80);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3945 Dynarr_add (dst, c | 0x80);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3946 ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3947 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3948 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3949 ch = c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3950 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3951 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3952

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3953 default: /* two-byte private */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3954 if (ch)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3955 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3956 Dynarr_add (dst, PRE_LEADING_BYTE_PRIVATE_2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3957 Dynarr_add (dst, lb);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3958 Dynarr_add (dst, ch | 0x80);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3959 Dynarr_add (dst, c | 0x80);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3960 ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3961 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3962 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3963 ch = c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3964 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3965 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3966

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3967 if (!ch)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3968 flags &= CODING_STATE_ISO2022_LOCK;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3969 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3970

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3971 label_continue_loop:;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3972 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3973

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3974 if (flags & CODING_STATE_END)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3975 DECODE_OUTPUT_PARTIAL_CHAR (ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3976

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3977 CODING_STREAM_COMPOSE (str, flags, ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3978 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3979

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3980

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3981 /***** ISO2022 encoder *****/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3982

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3983 /* Designate CHARSET into register REG. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3984

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3985 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3986 iso2022_designate (Lisp_Object charset, unsigned char reg,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3987 struct encoding_stream *str, unsigned_char_dynarr *dst)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3988 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3989 CONST char *inter94 = "()*+", *inter96= ",-./";

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3990 int type;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3991 unsigned char final;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3992 Lisp_Object old_charset = str->iso2022.charset[reg];

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3993

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3994 str->iso2022.charset[reg] = charset;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3995 if (!CHARSETP (charset))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3996 /* charset might be an initial nil or t. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3997 return;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3998 type = XCHARSET_TYPE (charset);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

3999 final = XCHARSET_FINAL (charset);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4000 if (!str->iso2022.force_charset_on_output[reg] &&

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4001 CHARSETP (old_charset) &&

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4002 XCHARSET_TYPE (old_charset) == type &&

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4003 XCHARSET_FINAL (old_charset) == final)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4004 return;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4005

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4006 str->iso2022.force_charset_on_output[reg] = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4007

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4008 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4009 charset_conversion_spec_dynarr *dyn =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4010 str->codesys->iso2022.output_conv;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4011

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4012 if (dyn)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4013 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4014 int i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4015

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4016 for (i = 0; i < Dynarr_length (dyn); i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4017 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4018 struct charset_conversion_spec *spec = Dynarr_atp (dyn, i);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4019 if (EQ (charset, spec->from_charset))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4020 charset = spec->to_charset;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4021 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4022 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4023 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4024

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4025 Dynarr_add (dst, ISO_CODE_ESC);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4026 switch (type)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4027 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4028 case CHARSET_TYPE_94:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4029 Dynarr_add (dst, inter94[reg]);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4030 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4031 case CHARSET_TYPE_96:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4032 Dynarr_add (dst, inter96[reg]);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4033 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4034 case CHARSET_TYPE_94X94:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4035 Dynarr_add (dst, '$');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4036 if (reg != 0

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4037 || !(CODING_SYSTEM_ISO2022_SHORT (str->codesys))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4038 || final < '@'

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4039 || final > 'B')

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4040 Dynarr_add (dst, inter94[reg]);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4041 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4042 case CHARSET_TYPE_96X96:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4043 Dynarr_add (dst, '$');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4044 Dynarr_add (dst, inter96[reg]);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4045 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4046 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4047 Dynarr_add (dst, final);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4048 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4049

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4050 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4051 ensure_normal_shift (struct encoding_stream *str, unsigned_char_dynarr *dst)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4052 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4053 if (str->iso2022.register_left != 0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4054 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4055 Dynarr_add (dst, ISO_CODE_SI);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4056 str->iso2022.register_left = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4057 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4058 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4059

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4060 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4061 ensure_shift_out (struct encoding_stream *str, unsigned_char_dynarr *dst)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4062 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4063 if (str->iso2022.register_left != 1)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4064 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4065 Dynarr_add (dst, ISO_CODE_SO);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4066 str->iso2022.register_left = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4067 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4068 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4069

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4070 /* Convert internally-formatted data to ISO2022 format. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4071

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4072 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4073 encode_coding_iso2022 (Lstream *encoding, CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4074 unsigned_char_dynarr *dst, unsigned int n)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4075 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4076 unsigned char charmask, c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4077 unsigned int flags, ch, eol;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4078 unsigned char char_boundary;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4079 struct encoding_stream *str = ENCODING_STREAM_DATA (encoding);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4080 struct Lisp_Coding_System *codesys = str->codesys;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4081 int i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4082 Lisp_Object charset;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4083 int half;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4084

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4085 /* flags for handling composite chars. We do a little switcharoo

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4086 on the source while we're outputting the composite char. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4087 unsigned int saved_n;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4088 CONST unsigned char *saved_src;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4089 int in_composite = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4090

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4091 CODING_STREAM_DECOMPOSE (str, flags, ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4092 eol = CODING_SYSTEM_EOL_TYPE (str->codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4093 char_boundary = str->iso2022.current_char_boundary;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4094 charset = str->iso2022.current_charset;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4095 half = str->iso2022.current_half;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4096

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4097 back_to_square_n:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4098 while (n--)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4099 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4100 c = *src++;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4101

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4102 if (BYTE_ASCII_P (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4103 { /* Processing ASCII character */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4104 ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4105

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4106 restore_left_to_right_direction (codesys, dst, &flags, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4107

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4108 /* Make sure G0 contains ASCII */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4109 if ((c > ' ' && c < ISO_CODE_DEL) ||

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4110 !CODING_SYSTEM_ISO2022_NO_ASCII_CNTL (codesys))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4111 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4112 ensure_normal_shift (str, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4113 iso2022_designate (Vcharset_ascii, 0, str, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4114 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4115

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4116 /* If necessary, restore everything to the default state

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4117 at end-of-line */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4118 if (c == '\n' &&

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4119 !(CODING_SYSTEM_ISO2022_NO_ASCII_EOL (codesys)))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4120 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4121 restore_left_to_right_direction (codesys, dst, &flags, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4122

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4123 ensure_normal_shift (str, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4124

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4125 for (i = 0; i < 4; i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4126 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4127 Lisp_Object initial_charset =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4128 CODING_SYSTEM_ISO2022_INITIAL_CHARSET (codesys, i);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4129 iso2022_designate (initial_charset, i, str, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4130 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4131 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4132 if (c == '\n')

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4133 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4134 if (eol != EOL_LF && eol != EOL_AUTODETECT)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4135 Dynarr_add (dst, '\r');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4136 if (eol != EOL_CR)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4137 Dynarr_add (dst, c);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4138 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4139 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4140 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4141 if (CODING_SYSTEM_ISO2022_ESCAPE_QUOTED (codesys)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4142 && fit_to_be_escape_quoted (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4143 Dynarr_add (dst, ISO_CODE_ESC);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4144 Dynarr_add (dst, c);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4145 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4146 char_boundary = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4147 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4148

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4149 else if (BUFBYTE_LEADING_BYTE_P (c) || BUFBYTE_LEADING_BYTE_P (ch))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4150 { /* Processing Leading Byte */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4151 ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4152 charset = CHARSET_BY_LEADING_BYTE (c);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4153 if (c == PRE_LEADING_BYTE_PRIVATE_1 ||

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4154 c == PRE_LEADING_BYTE_PRIVATE_2)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4155 ch = c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4156 else if (!EQ (charset, Vcharset_control_1)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4157 && !EQ (charset, Vcharset_composite))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4158 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4159 int reg;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4160

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4161 ensure_correct_direction (XCHARSET_DIRECTION (charset),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4162 codesys, dst, &flags, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4163

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4164 /* Now determine which register to use. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4165 reg = -1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4166 for (i = 0; i < 4; i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4167 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4168 if (EQ (charset, str->iso2022.charset[i]) ||

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4169 EQ (charset,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4170 CODING_SYSTEM_ISO2022_INITIAL_CHARSET (codesys, i)))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4171 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4172 reg = i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4173 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4174 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4175 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4176

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4177 if (reg == -1)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4178 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4179 if (XCHARSET_GRAPHIC (charset) != 0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4180 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4181 if (!NILP (str->iso2022.charset[1]) &&

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4182 (!CODING_SYSTEM_ISO2022_SEVEN (codesys) ||

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4183 CODING_SYSTEM_ISO2022_LOCK_SHIFT (codesys)))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4184 reg = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4185 else if (!NILP (str->iso2022.charset[2]))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4186 reg = 2;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4187 else if (!NILP (str->iso2022.charset[3]))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4188 reg = 3;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4189 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4190 reg = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4191 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4192 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4193 reg = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4194 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4195

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4196 iso2022_designate (charset, reg, str, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4197

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4198 /* Now invoke that register. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4199 switch (reg)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4200 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4201 case 0:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4202 ensure_normal_shift (str, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4203 half = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4204 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4205

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4206 case 1:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4207 if (CODING_SYSTEM_ISO2022_SEVEN (codesys))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4208 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4209 ensure_shift_out (str, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4210 half = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4211 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4212 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4213 half = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4214 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4215

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4216 case 2:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4217 if (CODING_SYSTEM_ISO2022_SEVEN (str->codesys))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4218 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4219 Dynarr_add (dst, ISO_CODE_ESC);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4220 Dynarr_add (dst, 'N');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4221 half = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4222 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4223 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4224 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4225 Dynarr_add (dst, ISO_CODE_SS2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4226 half = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4227 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4228 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4229

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4230 case 3:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4231 if (CODING_SYSTEM_ISO2022_SEVEN (str->codesys))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4232 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4233 Dynarr_add (dst, ISO_CODE_ESC);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4234 Dynarr_add (dst, 'O');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4235 half = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4236 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4237 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4238 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4239 Dynarr_add (dst, ISO_CODE_SS3);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4240 half = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4241 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4242 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4243

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4244 default:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4245 abort ();

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4246 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4247 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4248 char_boundary = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4249 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4250 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4251 { /* Processing Non-ASCII character */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4252 charmask = (half == 0 ? 0x7F : 0xFF);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4253 char_boundary = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4254 if (EQ (charset, Vcharset_control_1))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4255 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4256 if (CODING_SYSTEM_ISO2022_ESCAPE_QUOTED (codesys)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4257 && fit_to_be_escape_quoted (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4258 Dynarr_add (dst, ISO_CODE_ESC);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4259 /* you asked for it ... */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4260 Dynarr_add (dst, c - 0x20);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4261 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4262 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4263 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4264 switch (XCHARSET_REP_BYTES (charset))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4265 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4266 case 2:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4267 Dynarr_add (dst, c & charmask);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4268 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4269 case 3:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4270 if (XCHARSET_PRIVATE_P (charset))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4271 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4272 Dynarr_add (dst, c & charmask);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4273 ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4274 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4275 else if (ch)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4276 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4277 if (EQ (charset, Vcharset_composite))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4278 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4279 if (in_composite)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4280 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4281 /* #### Bother! We don't know how to

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4282 handle this yet. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4283 Dynarr_add (dst, '~');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4284 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4285 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4286 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4287 Emchar emch = MAKE_CHAR (Vcharset_composite,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4288 ch & 0x7F, c & 0x7F);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4289 Lisp_Object lstr = composite_char_string (emch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4290 saved_n = n;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4291 saved_src = src;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4292 in_composite = 1;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4293 src = XSTRING_DATA (lstr);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4294 n = XSTRING_LENGTH (lstr);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4295 Dynarr_add (dst, ISO_CODE_ESC);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4296 Dynarr_add (dst, '0'); /* start composing */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4297 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4298 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4299 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4300 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4301 Dynarr_add (dst, ch & charmask);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4302 Dynarr_add (dst, c & charmask);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4303 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4304 ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4305 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4306 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4307 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4308 ch = c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4309 char_boundary = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4310 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4311 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4312 case 4:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4313 if (ch)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4314 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4315 Dynarr_add (dst, ch & charmask);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4316 Dynarr_add (dst, c & charmask);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4317 ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4318 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4319 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4320 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4321 ch = c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4322 char_boundary = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4323 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4324 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4325 default:

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4326 abort ();

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4327 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4328 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4329 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4330 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4331

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4332 if (in_composite)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4333 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4334 n = saved_n;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4335 src = saved_src;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4336 in_composite = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4337 Dynarr_add (dst, ISO_CODE_ESC);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4338 Dynarr_add (dst, '1'); /* end composing */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4339 goto back_to_square_n; /* Wheeeeeeeee ..... */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4340 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4341

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4342 if (char_boundary && flags & CODING_STATE_END)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4343 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4344 restore_left_to_right_direction (codesys, dst, &flags, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4345 ensure_normal_shift (str, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4346 for (i = 0; i < 4; i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4347 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4348 Lisp_Object initial_charset =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4349 CODING_SYSTEM_ISO2022_INITIAL_CHARSET (codesys, i);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4350 iso2022_designate (initial_charset, i, str, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4351 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4352 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4353

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4354 CODING_STREAM_COMPOSE (str, flags, ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4355 str->iso2022.current_char_boundary = char_boundary;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4356 str->iso2022.current_charset = charset;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4357 str->iso2022.current_half = half;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4358

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4359 /* Verbum caro factum est! */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4360 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4361

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4362

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4363 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4364 /* No-conversion methods */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4365 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4366

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4367 /* This is used when reading in "binary" files -- i.e. files that may

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4368 contain all 256 possible byte values and that are not to be

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4369 interpreted as being in any particular decoding. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4370 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4371 decode_coding_no_conversion (Lstream *decoding, CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4372 unsigned_char_dynarr *dst, unsigned int n)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4373 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4374 unsigned char c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4375 unsigned int flags, ch;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4376 int eol;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4377 struct decoding_stream *str = DECODING_STREAM_DATA (decoding);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4378

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4379 CODING_STREAM_DECOMPOSE (str, flags, ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4380 eol = str->eol_type;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4381

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4382 while (n--)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4383 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4384 c = *src++;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4385

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4386 DECODE_HANDLE_EOL_TYPE (eol, c, flags, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4387 DECODE_ADD_BINARY_CHAR (c, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4388 label_continue_loop:;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4389 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4390

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4391 DECODE_HANDLE_END_OF_CONVERSION (flags, ch, dst);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4392

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4393 CODING_STREAM_COMPOSE (str, flags, ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4394 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4395

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4396 static void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4397 encode_coding_no_conversion (Lstream *encoding, CONST unsigned char *src,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4398 unsigned_char_dynarr *dst, unsigned int n)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4399 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4400 unsigned char c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4401 struct encoding_stream *str = ENCODING_STREAM_DATA (encoding);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4402 unsigned int flags, ch, eol;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4403

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4404 CODING_STREAM_DECOMPOSE (str, flags, ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4405 eol = CODING_SYSTEM_EOL_TYPE (str->codesys);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4406

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4407 while (n--)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4408 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4409 c = *src++;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4410 if (c == '\n')

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4411 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4412 if (eol != EOL_LF && eol != EOL_AUTODETECT)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4413 Dynarr_add (dst, '\r');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4414 if (eol != EOL_CR)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4415 Dynarr_add (dst, '\n');

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4416 ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4417 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4418 else if (BYTE_ASCII_P (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4419 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4420 assert (ch == 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4421 Dynarr_add (dst, c);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4422 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4423 else if (BUFBYTE_LEADING_BYTE_P (c))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4424 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4425 assert (ch == 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4426 if (c == LEADING_BYTE_LATIN_1 || c == LEADING_BYTE_CONTROL_1)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4427 ch = c;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4428 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4429 Dynarr_add (dst, '~'); /* untranslatable character */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4430 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4431 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4432 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4433 if (ch == LEADING_BYTE_LATIN_1)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4434 Dynarr_add (dst, c);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4435 else if (ch == LEADING_BYTE_CONTROL_1)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4436 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4437 assert (c < 0xC0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4438 Dynarr_add (dst, c - 0x20);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4439 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4440 /* else it should be the second or third byte of an

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4441 untranslatable character, so ignore it */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4442 ch = 0;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4443 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4444 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4445

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4446 CODING_STREAM_COMPOSE (str, flags, ch);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4447 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4448

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4449

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4450 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4451 /* Simple internal/external functions */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4452 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4453

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4454 static extbyte_dynarr *conversion_out_dynarr;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4455 static bufbyte_dynarr *conversion_in_dynarr;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4456

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4457 /* Determine coding system from coding format */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4458

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4459 #define PATHNAME_CODING_SYSTEM \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4460 ((NILP (Vpathname_coding_system) || \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4461 (EQ ((Vpathname_coding_system), Qbinary))) ? \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4462 Qnil : Fget_coding_system (Vpathname_coding_system))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4463

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4464 /* #### not correct for all values of `fmt'! */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4465 #define FMT_CODING_SYSTEM(fmt) \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4466 (((fmt) == FORMAT_FILENAME) ? PATHNAME_CODING_SYSTEM : \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4467 ((fmt) == FORMAT_CTEXT ) ? Fget_coding_system (Qctext) : \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4468 ((fmt) == FORMAT_TERMINAL) ? PATHNAME_CODING_SYSTEM : \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4469 Qnil)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4470

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4471 extern CONST Extbyte *

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4472 convert_to_external_format (CONST Bufbyte *ptr,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4473 Bytecount len,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4474 Extcount *len_out,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4475 enum external_data_format fmt)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4476 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4477 Lisp_Object coding_system = FMT_CODING_SYSTEM (fmt);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4478

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4479 if (!conversion_out_dynarr)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4480 conversion_out_dynarr = Dynarr_new (Extbyte);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4481 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4482 Dynarr_reset (conversion_out_dynarr);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4483

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4484 if (NILP (coding_system))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4485 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4486 CONST Bufbyte *end = ptr + len;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4487

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4488 for (; ptr < end;)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4489 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4490 Bufbyte c =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4491 (BYTE_ASCII_P (*ptr)) ? *ptr :

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4492 (*ptr == LEADING_BYTE_CONTROL_1) ? (*(ptr+1) - 0x20) :

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4493 (*ptr == LEADING_BYTE_LATIN_1) ? (*(ptr+1)) :

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4494 '~';

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4495

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4496 Dynarr_add (conversion_out_dynarr, (Extbyte) c);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4497 INC_CHARPTR (ptr);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4498 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4499

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4500 #ifdef ERROR_CHECK_BUFPOS

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4501 assert (ptr == end);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4502 #endif

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4503 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4504 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4505 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4506 Lisp_Object instream =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4507 make_fixed_buffer_input_stream ((unsigned char *) ptr, len);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4508 Lisp_Object outstream = make_dynarr_output_stream

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4509 ((unsigned_char_dynarr *) conversion_out_dynarr);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4510 struct gcpro gcpro1, gcpro2;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4511 char tempbuf[1024]; /* some random amount */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4512

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4513 outstream =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4514 make_encoding_output_stream (XLSTREAM (outstream), coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4515 GCPRO2 (instream, outstream); /* Necessary?? */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4516 while (1)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4517 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4518 int size_in_bytes = Lstream_read (XLSTREAM (instream),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4519 tempbuf, sizeof (tempbuf));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4520 if (!size_in_bytes)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4521 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4522 Lstream_write (XLSTREAM (outstream), tempbuf, size_in_bytes);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4523 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4524 Lstream_close (XLSTREAM (instream));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4525 Lstream_close (XLSTREAM (outstream));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4526 UNGCPRO;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4527 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4528

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4529 *len_out = Dynarr_length (conversion_out_dynarr);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4530 Dynarr_add (conversion_out_dynarr, 0); /* remember to zero-terminate! */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4531 return Dynarr_atp (conversion_out_dynarr, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4532 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4533

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4534 extern CONST Bufbyte *

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4535 convert_from_external_format (CONST Extbyte *ptr,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4536 Extcount len,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4537 Bytecount *len_out,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4538 enum external_data_format fmt)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4539 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4540 Lisp_Object coding_system = FMT_CODING_SYSTEM (fmt);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4541

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4542 if (!conversion_in_dynarr)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4543 conversion_in_dynarr = Dynarr_new (Bufbyte);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4544 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4545 Dynarr_reset (conversion_in_dynarr);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4546

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4547 if (NILP (coding_system))

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4548 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4549 CONST Extbyte *end = ptr + len;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4550 for (; ptr < end; ptr++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4551 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4552 Extbyte c = *ptr;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4553 DECODE_ADD_BINARY_CHAR (c, conversion_in_dynarr);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4554 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4555 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4556 else

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4557 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4558 Lisp_Object instream =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4559 make_fixed_buffer_input_stream ((unsigned char *) ptr, len);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4560 Lisp_Object outstream = make_dynarr_output_stream

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4561 ((unsigned_char_dynarr *) conversion_in_dynarr);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4562 struct gcpro gcpro1, gcpro2;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4563 char tempbuf[1024]; /* some random amount */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4564

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4565 outstream =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4566 make_decoding_output_stream (XLSTREAM (outstream), coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4567 GCPRO2 (instream, outstream); /* Necessary?? */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4568 while (1)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4569 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4570 int size_in_bytes = Lstream_read (XLSTREAM (instream),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4571 tempbuf, sizeof (tempbuf));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4572 if (!size_in_bytes)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4573 break;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4574 Lstream_write (XLSTREAM (outstream), tempbuf, size_in_bytes);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4575 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4576 Lstream_close (XLSTREAM (instream));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4577 Lstream_close (XLSTREAM (outstream));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4578 UNGCPRO;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4579 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4580

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4581 *len_out = Dynarr_length (conversion_in_dynarr);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4582 Dynarr_add (conversion_in_dynarr, 0); /* remember to zero-terminate! */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4583 return Dynarr_atp (conversion_in_dynarr, 0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4584 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4585

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4586

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4587 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4588 /* Initialization */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4589 /************************************************************************/

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4590

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4591 void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4592 syms_of_mule_coding (void)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4593 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4594 defsymbol (&Qfile_coding_system, "file-coding-system");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4595 deferror (&Qcoding_system_error, "coding-system-error",

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4596 "Coding-system error", Qio_error);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4597

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4598 DEFSUBR (Fcoding_system_p);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4599 DEFSUBR (Ffind_coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4600 DEFSUBR (Fget_coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4601 DEFSUBR (Fcoding_system_list);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4602 DEFSUBR (Fcoding_system_name);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4603 DEFSUBR (Fmake_coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4604 DEFSUBR (Fcopy_coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4605 DEFSUBR (Fsubsidiary_coding_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4606

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4607 DEFSUBR (Fcoding_system_type);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4608 DEFSUBR (Fcoding_system_doc_string);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4609 DEFSUBR (Fcoding_system_property);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4610

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4611 DEFSUBR (Fcoding_category_list);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4612 DEFSUBR (Fset_coding_priority_list);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4613 DEFSUBR (Fcoding_priority_list);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4614 DEFSUBR (Fset_coding_category_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4615 DEFSUBR (Fcoding_category_system);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4616

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4617 DEFSUBR (Fdetect_coding_region);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4618 DEFSUBR (Fdecode_coding_region);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4619 DEFSUBR (Fencode_coding_region);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4620 DEFSUBR (Fdecode_shift_jis_char);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4621 DEFSUBR (Fencode_shift_jis_char);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4622 DEFSUBR (Fdecode_big5_char);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4623 DEFSUBR (Fencode_big5_char);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4624

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4625 defsymbol (&Qcoding_system_p, "coding-system-p");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4626

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4627 defsymbol (&Qbig5, "big5");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4628 defsymbol (&Qshift_jis, "shift-jis");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4629 defsymbol (&Qno_conversion, "no-conversion");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4630 defsymbol (&Qccl, "ccl");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4631 defsymbol (&Qiso2022, "iso2022");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4632

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4633 defsymbol (&Qmnemonic, "mnemonic");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4634 defsymbol (&Qeol_type, "eol-type");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4635 defsymbol (&Qpost_read_conversion, "post-read-conversion");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4636 defsymbol (&Qpre_write_conversion, "pre-write-conversion");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4637

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4638 defsymbol (&Qcr, "cr");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4639 defsymbol (&Qlf, "lf");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4640 defsymbol (&Qcrlf, "crlf");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4641 defsymbol (&Qeol_cr, "eol-cr");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4642 defsymbol (&Qeol_lf, "eol-lf");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4643 defsymbol (&Qeol_crlf, "eol-crlf");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4644

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4645 defsymbol (&Qcharset_g0, "charset-g0");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4646 defsymbol (&Qcharset_g1, "charset-g1");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4647 defsymbol (&Qcharset_g2, "charset-g2");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4648 defsymbol (&Qcharset_g3, "charset-g3");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4649 defsymbol (&Qforce_g0_on_output, "force-g0-on-output");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4650 defsymbol (&Qforce_g1_on_output, "force-g1-on-output");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4651 defsymbol (&Qforce_g2_on_output, "force-g2-on-output");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4652 defsymbol (&Qforce_g3_on_output, "force-g3-on-output");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4653 defsymbol (&Qshort, "short");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4654 defsymbol (&Qno_ascii_eol, "no-ascii-eol");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4655 defsymbol (&Qno_ascii_cntl, "no-ascii-cntl");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4656 defsymbol (&Qseven, "seven");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4657 defsymbol (&Qlock_shift, "lock-shift");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4658 defsymbol (&Qno_iso6429, "no-iso6429");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4659 defsymbol (&Qescape_quoted, "escape-quoted");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4660 defsymbol (&Qinput_charset_conversion, "input-charset-conversion");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4661 defsymbol (&Qoutput_charset_conversion, "output-charset-conversion");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4662

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4663 defsymbol (&Qencode, "encode");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4664 defsymbol (&Qdecode, "decode");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4665

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4666 defsymbol (&Qctext, "ctext");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4667

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4668 defsymbol (&coding_category_symbol[CODING_CATEGORY_SHIFT_JIS],

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4669 "shift-jis");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4670 defsymbol (&coding_category_symbol[CODING_CATEGORY_ISO_7],

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4671 "iso-7");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4672 defsymbol (&coding_category_symbol[CODING_CATEGORY_ISO_8_DESIGNATE],

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4673 "iso-8-designate");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4674 defsymbol (&coding_category_symbol[CODING_CATEGORY_ISO_8_1],

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4675 "iso-8-1");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4676 defsymbol (&coding_category_symbol[CODING_CATEGORY_ISO_8_2],

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4677 "iso-8-2");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4678 defsymbol (&coding_category_symbol[CODING_CATEGORY_ISO_LOCK_SHIFT],

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4679 "iso-lock-shift");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4680 defsymbol (&coding_category_symbol[CODING_CATEGORY_BIG5],

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4681 "big5");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4682 defsymbol (&coding_category_symbol[CODING_CATEGORY_NO_CONVERSION],

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4683 "no-conversion");

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4684 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4685

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4686 void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4687 lstream_type_create_mule_coding (void)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4688 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4689 LSTREAM_HAS_METHOD (decoding, reader);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4690 LSTREAM_HAS_METHOD (decoding, writer);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4691 LSTREAM_HAS_METHOD (decoding, rewinder);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4692 LSTREAM_HAS_METHOD (decoding, seekable_p);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4693 LSTREAM_HAS_METHOD (decoding, flusher);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4694 LSTREAM_HAS_METHOD (decoding, closer);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4695 LSTREAM_HAS_METHOD (decoding, marker);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4696

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4697 LSTREAM_HAS_METHOD (encoding, reader);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4698 LSTREAM_HAS_METHOD (encoding, writer);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4699 LSTREAM_HAS_METHOD (encoding, rewinder);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4700 LSTREAM_HAS_METHOD (encoding, seekable_p);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4701 LSTREAM_HAS_METHOD (encoding, flusher);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4702 LSTREAM_HAS_METHOD (encoding, closer);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4703 LSTREAM_HAS_METHOD (encoding, marker);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4704 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4705

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4706 void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4707 vars_of_mule_coding (void)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4708 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4709 int i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4710

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4711 /* Initialize to something reasonable ... */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4712 for (i = 0; i <= CODING_CATEGORY_LAST; i++)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4713 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4714 coding_category_system[i] = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4715 coding_category_by_priority[i] = i;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4716 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4717

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4718 DEFVAR_LISP ("keyboard-coding-system", &Vkeyboard_coding_system /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4719 Coding system used for TTY keyboard input.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4720 Not used under a windowing system.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4721 */ );

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4722 Vkeyboard_coding_system = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4723

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4724 DEFVAR_LISP ("terminal-coding-system", &Vterminal_coding_system /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4725 Coding system used for TTY display output.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4726 Not used under a windowing system.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4727 */ );

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4728 Vterminal_coding_system = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4729

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4730 DEFVAR_LISP ("process-input-coding-system", &Vprocess_input_coding_system /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4731 Default coding system used by C process routines for inputting data.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4732 This can be changed for a particular process using

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4733 `set-process-input-coding-system'.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4734 */ );

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4735 Vprocess_input_coding_system = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4736

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4737 DEFVAR_LISP ("process-output-coding-system",

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4738 &Vprocess_output_coding_system /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4739 Default coding system used by C process routines for outputting data.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4740 This can be changed for a particular process using

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4741 `set-process-output-coding-system'.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4742 */ );

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4743 Vprocess_output_coding_system = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4744

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4745 DEFVAR_LISP ("pathname-coding-system", &Vpathname_coding_system /*

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4746 Coding system used to convert pathnames when accessing files.

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4747 */ );

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4748 Vpathname_coding_system = Qnil;

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4749 }

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4750

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4751 void

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4752 complex_vars_of_mule_coding (void)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4753 {

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4754 staticpro (&Vcoding_system_hashtable);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4755 Vcoding_system_hashtable = make_lisp_hashtable (50, HASHTABLE_NONWEAK,

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4756 HASHTABLE_EQ);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4757

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4758 the_codesys_prop_dynarr = Dynarr_new (struct codesys_prop);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4759

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4760 #define DEFINE_CODESYS_PROP(Prop_Type, Sym) do \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4761 { \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4762 struct codesys_prop csp; \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4763 csp.sym = (Sym); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4764 csp.prop_type = (Prop_Type); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4765 Dynarr_add (the_codesys_prop_dynarr, csp); \

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4766 } while (0)

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4767

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4768 DEFINE_CODESYS_PROP (CODESYS_PROP_ALL_OK, Qmnemonic);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4769 DEFINE_CODESYS_PROP (CODESYS_PROP_ALL_OK, Qeol_type);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4770 DEFINE_CODESYS_PROP (CODESYS_PROP_ALL_OK, Qeol_cr);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4771 DEFINE_CODESYS_PROP (CODESYS_PROP_ALL_OK, Qeol_crlf);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4772 DEFINE_CODESYS_PROP (CODESYS_PROP_ALL_OK, Qeol_lf);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4773 DEFINE_CODESYS_PROP (CODESYS_PROP_ALL_OK, Qpost_read_conversion);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4774 DEFINE_CODESYS_PROP (CODESYS_PROP_ALL_OK, Qpre_write_conversion);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4775

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4776 DEFINE_CODESYS_PROP (CODESYS_PROP_ISO2022, Qcharset_g0);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4777 DEFINE_CODESYS_PROP (CODESYS_PROP_ISO2022, Qcharset_g1);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4778 DEFINE_CODESYS_PROP (CODESYS_PROP_ISO2022, Qcharset_g2);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4779 DEFINE_CODESYS_PROP (CODESYS_PROP_ISO2022, Qcharset_g3);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4780 DEFINE_CODESYS_PROP (CODESYS_PROP_ISO2022, Qforce_g0_on_output);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4781 DEFINE_CODESYS_PROP (CODESYS_PROP_ISO2022, Qforce_g1_on_output);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4782 DEFINE_CODESYS_PROP (CODESYS_PROP_ISO2022, Qforce_g2_on_output);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4783 DEFINE_CODESYS_PROP (CODESYS_PROP_ISO2022, Qforce_g3_on_output);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4784 DEFINE_CODESYS_PROP (CODESYS_PROP_ISO2022, Qshort);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4785 DEFINE_CODESYS_PROP (CODESYS_PROP_ISO2022, Qno_ascii_eol);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4786 DEFINE_CODESYS_PROP (CODESYS_PROP_ISO2022, Qno_ascii_cntl);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4787 DEFINE_CODESYS_PROP (CODESYS_PROP_ISO2022, Qseven);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4788 DEFINE_CODESYS_PROP (CODESYS_PROP_ISO2022, Qlock_shift);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4789 DEFINE_CODESYS_PROP (CODESYS_PROP_ISO2022, Qno_iso6429);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4790 DEFINE_CODESYS_PROP (CODESYS_PROP_ISO2022, Qescape_quoted);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4791 DEFINE_CODESYS_PROP (CODESYS_PROP_ISO2022, Qinput_charset_conversion);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4792 DEFINE_CODESYS_PROP (CODESYS_PROP_ISO2022, Qoutput_charset_conversion);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4793

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4794 DEFINE_CODESYS_PROP (CODESYS_PROP_CCL, Qencode);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4795 DEFINE_CODESYS_PROP (CODESYS_PROP_CCL, Qdecode);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4796

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4797 /* Need to create this here or we're really screwed. */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4798 Fmake_coding_system (Qno_conversion, Qno_conversion, build_string ("No conversion"),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4799 list2 (Qmnemonic, build_string ("Noconv")));

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4800

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4801 Fcopy_coding_system (Fcoding_system_property (Qno_conversion, Qeol_lf),

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4802 Qbinary);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4803

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4804 /* Need this for bootstrapping */

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4805 coding_category_system[CODING_CATEGORY_NO_CONVERSION] =

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4806 Fget_coding_system (Qno_conversion);

131b0175ea99 Import from CVS: tag r20-0b30

cvs

parents:

diff changeset

4807 }

Mercurial > hg > xemacs-beta

annotate src/mule-coding.c @ 70:131b0175ea99 r20-0b30