Upgrade experimental from version 0.17 to 0.18

[perl5.git] / inline.h
diff --git a/inline.h b/inline.h

index 309d74f..98d9edc 100644 (file)
--- a/inline.h
+++ b/inline.h
@@ -400,7 +400,7 @@ S_is_utf8_invariant_string_loc(const U8* const s, STRLEN len, const U8 ** ep)
  #    define PERL_VARIANTS_WORD_MASK 0x80808080
  #    define PERL_WORD_BOUNDARY_MASK 0x3
  #  elif PERL_WORDSIZE == 8
-#    define PERL_VARIANTS_WORD_MASK 0x8080808080808080
+#    define PERL_VARIANTS_WORD_MASK UINT64_C(0x8080808080808080)
  #    define PERL_WORD_BOUNDARY_MASK 0x7
  #  else
  #    error Unexpected word size
@@ -652,8 +652,7 @@ C<L</is_c9strict_utf8_string_loclen>>.
  PERL_STATIC_INLINE bool
  S_is_utf8_string_flags(const U8 *s, STRLEN len, const U32 flags)
  {
-    const U8* send;
-    const U8* x = s;
+    const U8 * first_variant;
  
      PERL_ARGS_ASSERT_IS_UTF8_STRING_FLAGS;
      assert(0 == (flags & ~(UTF8_DISALLOW_ILLEGAL_INTERCHANGE
@@ -679,13 +678,17 @@ S_is_utf8_string_flags(const U8 *s, STRLEN len, const U32 flags)
          return is_c9strict_utf8_string(s, len);
      }
  
-    send = s + len;
-    while (x < send) {
-        STRLEN cur_len = isUTF8_CHAR_flags(x, send, flags);
-        if (UNLIKELY(! cur_len)) {
-            return FALSE;
+    if (! is_utf8_invariant_string_loc(s, len, &first_variant)) {
+        const U8* const send = s + len;
+        const U8* x = first_variant;
+
+        while (x < send) {
+            STRLEN cur_len = isUTF8_CHAR_flags(x, send, flags);
+            if (UNLIKELY(! cur_len)) {
+                return FALSE;
+            }
+            x += cur_len;
          }
-        x += cur_len;
      }
  
      return TRUE;
@@ -721,31 +724,50 @@ See also C<L</is_utf8_string_loc>>.
  */
  
  PERL_STATIC_INLINE bool
-Perl_is_utf8_string_loclen(const U8 *s, const STRLEN len, const U8 **ep, STRLEN *el)
+Perl_is_utf8_string_loclen(const U8 *s, STRLEN len, const U8 **ep, STRLEN *el)
  {
-    const U8* const send = s + (len ? len : strlen((const char *)s));
-    const U8* x = s;
-    STRLEN outlen = 0;
+    const U8 * first_variant;
  
      PERL_ARGS_ASSERT_IS_UTF8_STRING_LOCLEN;
  
-    while (x < send) {
-        const STRLEN cur_len = isUTF8_CHAR(x, send);
-        if (UNLIKELY(! cur_len)) {
-            break;
-        }
-        x += cur_len;
-        outlen++;
+    if (len == 0) {
+        len = strlen((const char *) s);
      }
  
-    if (el)
-        *el = outlen;
+    if (is_utf8_invariant_string_loc(s, len, &first_variant)) {
+        if (el)
+            *el = len;
+
+        if (ep) {
+            *ep = s + len;
+        }
  
-    if (ep) {
-        *ep = x;
+        return TRUE;
      }
  
-    return (x == send);
+    {
+        const U8* const send = s + len;
+        const U8* x = first_variant;
+        STRLEN outlen = first_variant - s;
+
+        while (x < send) {
+            const STRLEN cur_len = isUTF8_CHAR(x, send);
+            if (UNLIKELY(! cur_len)) {
+                break;
+            }
+            x += cur_len;
+            outlen++;
+        }
+
+        if (el)
+            *el = outlen;
+
+        if (ep) {
+            *ep = x;
+        }
+
+        return (x == send);
+    }
  }
  
  /*
@@ -779,31 +801,50 @@ See also C<L</is_strict_utf8_string_loc>>.
  */
  
  PERL_STATIC_INLINE bool
-S_is_strict_utf8_string_loclen(const U8 *s, const STRLEN len, const U8 **ep, STRLEN *el)
+S_is_strict_utf8_string_loclen(const U8 *s, STRLEN len, const U8 **ep, STRLEN *el)
  {
-    const U8* const send = s + (len ? len : strlen((const char *)s));
-    const U8* x = s;
-    STRLEN outlen = 0;
+    const U8 * first_variant;
  
      PERL_ARGS_ASSERT_IS_STRICT_UTF8_STRING_LOCLEN;
  
-    while (x < send) {
-        const STRLEN cur_len = isSTRICT_UTF8_CHAR(x, send);
-        if (UNLIKELY(! cur_len)) {
-            break;
-        }
-        x += cur_len;
-        outlen++;
+    if (len == 0) {
+        len = strlen((const char *) s);
      }
  
-    if (el)
-        *el = outlen;
+    if (is_utf8_invariant_string_loc(s, len, &first_variant)) {
+        if (el)
+            *el = len;
+
+        if (ep) {
+            *ep = s + len;
+        }
  
-    if (ep) {
-        *ep = x;
+        return TRUE;
      }
  
-    return (x == send);
+    {
+        const U8* const send = s + len;
+        const U8* x = first_variant;
+        STRLEN outlen = first_variant - s;
+
+        while (x < send) {
+            const STRLEN cur_len = isSTRICT_UTF8_CHAR(x, send);
+            if (UNLIKELY(! cur_len)) {
+                break;
+            }
+            x += cur_len;
+            outlen++;
+        }
+
+        if (el)
+            *el = outlen;
+
+        if (ep) {
+            *ep = x;
+        }
+
+        return (x == send);
+    }
  }
  
  /*
@@ -837,31 +878,50 @@ See also C<L</is_c9strict_utf8_string_loc>>.
  */
  
  PERL_STATIC_INLINE bool
-S_is_c9strict_utf8_string_loclen(const U8 *s, const STRLEN len, const U8 **ep, STRLEN *el)
+S_is_c9strict_utf8_string_loclen(const U8 *s, STRLEN len, const U8 **ep, STRLEN *el)
  {
-    const U8* const send = s + (len ? len : strlen((const char *)s));
-    const U8* x = s;
-    STRLEN outlen = 0;
+    const U8 * first_variant;
  
      PERL_ARGS_ASSERT_IS_C9STRICT_UTF8_STRING_LOCLEN;
  
-    while (x < send) {
-        const STRLEN cur_len = isC9_STRICT_UTF8_CHAR(x, send);
-        if (UNLIKELY(! cur_len)) {
-            break;
-        }
-        x += cur_len;
-        outlen++;
+    if (len == 0) {
+        len = strlen((const char *) s);
      }
  
-    if (el)
-        *el = outlen;
+    if (is_utf8_invariant_string_loc(s, len, &first_variant)) {
+        if (el)
+            *el = len;
+
+        if (ep) {
+            *ep = s + len;
+        }
  
-    if (ep) {
-        *ep = x;
+        return TRUE;
      }
  
-    return (x == send);
+    {
+        const U8* const send = s + len;
+        const U8* x = first_variant;
+        STRLEN outlen = first_variant - s;
+
+        while (x < send) {
+            const STRLEN cur_len = isC9_STRICT_UTF8_CHAR(x, send);
+            if (UNLIKELY(! cur_len)) {
+                break;
+            }
+            x += cur_len;
+            outlen++;
+        }
+
+        if (el)
+            *el = outlen;
+
+        if (ep) {
+            *ep = x;
+        }
+
+        return (x == send);
+    }
  }
  
  /*
@@ -902,16 +962,14 @@ See also C<L</is_utf8_string_loc_flags>>.
  PERL_STATIC_INLINE bool
  S_is_utf8_string_loclen_flags(const U8 *s, STRLEN len, const U8 **ep, STRLEN *el, const U32 flags)
  {
-    const U8* send;
-    const U8* x = s;
-    STRLEN outlen = 0;
+    const U8 * first_variant;
  
      PERL_ARGS_ASSERT_IS_UTF8_STRING_LOCLEN_FLAGS;
      assert(0 == (flags & ~(UTF8_DISALLOW_ILLEGAL_INTERCHANGE
                            |UTF8_DISALLOW_PERL_EXTENDED)));
  
      if (len == 0) {
-        len = strlen((const char *)s);
+        len = strlen((const char *) s);
      }
  
      if (flags == 0) {
@@ -930,24 +988,40 @@ S_is_utf8_string_loclen_flags(const U8 *s, STRLEN len, const U8 **ep, STRLEN *el
          return is_c9strict_utf8_string_loclen(s, len, ep, el);
      }
  
-    send = s + len;
-    while (x < send) {
-        const STRLEN cur_len = isUTF8_CHAR_flags(x, send, flags);
-        if (UNLIKELY(! cur_len)) {
-            break;
+    if (is_utf8_invariant_string_loc(s, len, &first_variant)) {
+        if (el)
+            *el = len;
+
+        if (ep) {
+            *ep = s + len;
          }
-        x += cur_len;
-        outlen++;
+
+        return TRUE;
      }
  
-    if (el)
-        *el = outlen;
+    {
+        const U8* send = s + len;
+        const U8* x = first_variant;
+        STRLEN outlen = first_variant - s;
+
+        while (x < send) {
+            const STRLEN cur_len = isUTF8_CHAR_flags(x, send, flags);
+            if (UNLIKELY(! cur_len)) {
+                break;
+            }
+            x += cur_len;
+            outlen++;
+        }
  
-    if (ep) {
-        *ep = x;
-    }
+        if (el)
+            *el = outlen;
+
+        if (ep) {
+            *ep = x;
+        }
  
-    return (x == send);
+        return (x == send);
+    }
  }
  
  /*
@@ -1245,7 +1319,7 @@ complete, valid characters found in the C<el> pointer.
  
  PERL_STATIC_INLINE bool
  S_is_utf8_fixed_width_buf_loclen_flags(const U8 * const s,
-                                       const STRLEN len,
+                                       STRLEN len,
                                         const U8 **ep,
                                         STRLEN *el,
                                         const U32 flags)